奇客 图灵测试过时了,AI 需要新基准测试
图灵(Alan Turing)在 1950 年发表了模仿游戏论文引入图灵测试去回答“机器能否思考”这个问题。测试的目的是判断机器是否能表现出人类也无法区分的对话行为。图灵预言,到 2000 年在模仿游戏中普通人能区分人与机器人的概率将会低于 70%。亚马逊语音助手 Alexa 部门的首席科学家 Rohit Prasad 认为,随着 AI 被广泛整合到手机、汽车和家庭,人们现在关心的是人机之间的互动,而不是区分机器和人类。他认为图灵测试过时了,AI 需要新基准测试。Rohit Prasad 指出,最近几年的聊天机器人程序已经能欺骗三成以上的裁判相信它是人类,而愚弄 30% 的裁判这一阈值实际上是任意设定的,并无多大的意义。