“首次通过图灵测试的计算机”只是一场成功的娱乐宣传

36氪  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

昨天英国雷丁大学 宣布 ,俄罗斯人弗拉基米尔·维西罗夫(Vladimir Veselov)创立的人工智能软件尤金•古斯特曼(Eugene Goostman)通过了图灵测试。

我和许多人一样,看到这篇文章的标题时感到极为兴奋,然而看完内容后却又感到一阵空虚,心想,“通过了图灵测试,然后呢?这代表了怎样的技术进展呢?”

事实上,当我们认真体察这个所谓通过了图灵测试的软件古斯特曼后,便会发现三个问题:

1,聊天机器人古斯特曼的“背景设定”极为取巧。一个来自乌克兰的,母语不是英语的13岁男孩。他回答的许多问题都可以被理解为是因为他英语不好,或者太小而没有听懂,而不是因为他是一个AI。

2,古斯特曼只让33%的人相信它是一个13岁的,母语不是英语的乌克兰小孩。如果算成考试分数,这就是个大大的F。有人说,“当时图灵说的就是骗倒30%的人就算通过图灵测试了呀。” 然而当我们寻找这个标准的来源时却发现,图灵只是在论文中说过“我相信在50年内,人们能够编出这样一个程序,在经过5分钟的询问后,30%的询问者都能觉得回答问题的是真人,而非一个台机器”。也就是说,图灵从未提出这样的标准,“30%的人”,“5分钟的询问”只是他对未来50年AI发展预测中的两个因素而已。

3,既然我们知道了古斯特曼并没有通过“真正的”图灵测试,那其实可以看看其他达到了相应标准的聊天机器人。比如说,在1991年的一次比赛中,一个叫PC Therapist的聊天机器人成功骗倒10个裁判中的5个,让他们相信这是个真人。2011年,一个叫Cleverbot的程序让60%的使用者相信它是一个真正的人。

并且,从 BBC 的截图来看,古斯特曼和一个正常的聊天机器人没有区别,交谈者稍有经验便会发觉这是一个AI。

因此,MIT的计算机认知学教授Joshua Tenenbaum认为,这场测试完全没什么意义,只是做一个聊天机器人去满足一些标准罢了。

事实上,“图灵测试”是一个已经存在了65年的概念,许多研究者认为它已经不能检测现代的AI了。比如纽约大学的Gary Marcus教授便认为现代的“图灵测试”应该是,让AI看一段视频,然后就视频中的内容对它进行询问,如果它让所有人都觉得是真人,便算通过了。

人工智能自诞生以来已经获得了极大的发展,不论是推荐算法,google的 无人车 ,还是Siri,都是AI被运用在生活中的例子,我们真的有必要执着于这样一个65年前的测试标准么?

[本文编译自: wired.com ]

本文被转载1次

首发媒体 36氪 | 转发媒体

随意打赏

提交建议
微信扫一扫,分享给好友吧。