“首次通过图灵测试的计算机”只是一场成功的娱乐宣传

36氪 • 10年前扫码分享

昨天英国雷丁大学宣布，俄罗斯人弗拉基米尔·维西罗夫（Vladimir Veselov）创立的人工智能软件尤金•古斯特曼（Eugene Goostman）通过了图灵测试。

我和许多人一样，看到这篇文章的标题时感到极为兴奋，然而看完内容后却又感到一阵空虚，心想，“通过了图灵测试，然后呢？这代表了怎样的技术进展呢？”

事实上，当我们认真体察这个所谓通过了图灵测试的软件古斯特曼后，便会发现三个问题：

1，聊天机器人古斯特曼的“背景设定”极为取巧。一个来自乌克兰的，母语不是英语的13岁男孩。他回答的许多问题都可以被理解为是因为他英语不好，或者太小而没有听懂，而不是因为他是一个AI。

2，古斯特曼只让33%的人相信它是一个13岁的，母语不是英语的乌克兰小孩。如果算成考试分数，这就是个大大的F。有人说，“当时图灵说的就是骗倒30%的人就算通过图灵测试了呀。” 然而当我们寻找这个标准的来源时却发现，图灵只是在论文中说过“我相信在50年内，人们能够编出这样一个程序，在经过5分钟的询问后，30%的询问者都能觉得回答问题的是真人，而非一个台机器”。也就是说，图灵从未提出这样的标准，“30%的人”，“5分钟的询问”只是他对未来50年AI发展预测中的两个因素而已。

3，既然我们知道了古斯特曼并没有通过“真正的”图灵测试，那其实可以看看其他达到了相应标准的聊天机器人。比如说，在1991年的一次比赛中，一个叫PC Therapist的聊天机器人成功骗倒10个裁判中的5个，让他们相信这是个真人。2011年,一个叫Cleverbot的程序让60%的使用者相信它是一个真正的人。

并且，从 BBC 的截图来看，古斯特曼和一个正常的聊天机器人没有区别，交谈者稍有经验便会发觉这是一个AI。

因此，MIT的计算机认知学教授Joshua Tenenbaum认为，这场测试完全没什么意义，只是做一个聊天机器人去满足一些标准罢了。

事实上，“图灵测试”是一个已经存在了65年的概念，许多研究者认为它已经不能检测现代的AI了。比如纽约大学的Gary Marcus教授便认为现代的“图灵测试”应该是，让AI看一段视频，然后就视频中的内容对它进行询问，如果它让所有人都觉得是真人，便算通过了。

人工智能自诞生以来已经获得了极大的发展，不论是推荐算法，google的无人车，还是Siri，都是AI被运用在生活中的例子，我们真的有必要执着于这样一个65年前的测试标准么？

[本文编译自： wired.com ]

“首次通过图灵测试的计算机”只是一场成功的娱乐宣传

本文被转载1次

随意打赏