IBM人工智能与人类辩手唇枪舌战,虽败犹荣
[ 摘要 ]这是IBM Debater第二次和人类进行公开辩论赛。它在第一次公开比赛中,它击败了一位辩手,但却落败于另一位辩手。不过这一次,它的对手纳塔拉扬的实力远远更强 —— IBM研究人员本来也预计Debater这次会输。
腾讯科技讯 据外媒报道, IBM 开发了一个名为Debater的机器人,近日它在一场辩论赛中与一名人类辩手唇枪舌战,辩论的主题是政府是否应该给幼儿园提供补贴。当然大家真正想知道的是,人工智能(AI)是否能在辩论中战胜人类。
Debater的辩论对手名为哈里什·纳塔拉扬(Harish Natarajan),是2016年世界辩论锦标赛的决赛选手。数百名观众观看这场辩论赛后,更加倾向于赞同他的观点,而不是IBM Debater的。可见在知识、说服力和辩论技巧上,人类(至少是那些拥有牛津大学和剑桥大学学位的人)仍然能够占据上风。
相较于1997年IBM的计算机深蓝在国际象棋中击败人类,以及2017年人工智能在围棋中战胜最优秀的棋手,这次人类辩手获得的胜利可能并不是那么吸引眼球。但IBM的这个机器人显示,在存在歧义的场景下,以及进行辩论时,AI仍然可以派上用场。这和仅仅通过计分来判断谁赢谁输的情况有很大的不同。
“真正令我印象深刻的,是IBM Debater与人类合作时可能发挥出来的价值,” 纳塔拉扬在辩论后表示。他说,IBM的人工智能能够挖掘大量的信息,并为这些知识提供有用的背景。
这是IBM Debater第二次和人类进行公开辩论赛。它在第一次公开比赛中,它击败了一位辩手,但却落败于另一位辩手。不过这一次,它的对手纳塔拉扬的实力远远更强 —— IBM研究人员本来也预计Debater这次会输。
计算机的说服力
IBM Debater这次虽然失败了,但毫无疑问,在某个角度上它仍然是赢家:你会认真听它在说什么,并不仅仅是因为它是一台计算机。它很好地将自己的论点分解为几个部分,并利用各种研究数据来支持它们。虽然它做得不算完美,但也没有出现牛头不对马嘴的情况。
并且,它好像还有点喜欢说教人类。“为弱势群体提供机会,这是所有人的道德义务,”IBM Debater说。
Debater以 IBM云计算基础架构为依托,使用了一组功能强大的机器。
在这场辩论中,双方都有15分钟的时间做准备——不过IBM Debater可以利用新闻文章和学术研究论文中的100亿个句子。双方轮流发言,反驳另一方的论点,最后还要总结自己的论点。
比赛的计分规则是看看有多少人改变了想法。在辩论之前,79%的人赞成政府为幼儿园提供补贴,但观看了辩论之后,该数字下降了17个百分点,为62%。
在如今这个时代,苹果的Siri、亚马逊的Alexa和谷歌Assistant都能很好地理解我们的问题,并用语音进行回答,所以我们常常忘记可以与计算机交谈是一件多么了不起的事情。 IBM Debater则更进一步,可以一次连讲几分钟。
“它非常迷人,听起来很人性化,”辩论赛的主持人约翰·唐纳(John Donvan)说。
但是,你的笔记本电脑上可能不会很快就能安装类似 Debater这样的东西。它主要是在功能强大的服务器上运行的——这个服务器拥有28个处理核心和768GB的内存,大约是高端笔记本电脑的50倍。而且还有四个服务器提供支持,其中每个都有64GB的内存和2TB硬盘。
政府应该给幼儿园提供补贴吗?
在这场辩论中,Debater是正方,赞成给幼儿园提供补贴。人类辩手纳塔拉扬是反方。
Debater表示,幼儿园“为整个社会带来利益。我们有责任支持幼儿园。”如果孩子们能进入好的幼儿园,他们以后会生活得更好,特别是来自贫困家庭的孩子。
纳塔拉扬则反驳说,幼儿园补贴“只不过是政治作秀,获得好处的是中产阶级,而不是最弱势群体。”他还找出了Debater的假设中的一些漏洞,例如,Debater的一个假设是补贴真的可以改善穷人的教育状况。
Debater在这场辩论中的表现比以前有所提高。它掌握的一个新能力是进行平行论证 —— 比如,对医疗系统提供补贴可能是有益的。另外,它的反驳能力也更强了。当纳塔拉扬表示,有些孩子可能无法从3岁或4岁的学龄前竞争活动中受益之后,IBM抓住了这一观点进行反驳。“对方辩手认为,幼儿园是有害的。”它说。
“从去年6月以来,我们一直在努力改进这个AI系统,”该项目的首席研究员诺姆·斯洛尼姆(Noam Slonim)说。 Debater的源材料是学术出版物和新闻文章,现在已经扩展到了2018年底的最新资料。
大家在讨论IBM的人工智能辩论技术。从左到右:首席研究员诺姆·斯洛尼姆、IBM Debater项目的屏幕、项目经理伦特·阿霍诺夫,以及人类辩手纳塔拉扬。
迄今为止最具挑战性的比赛
对于IBM的辩论AI来说,这场比赛的难度是迄今为止最大的。
“与我们之前面对的辩手相比,纳塔拉扬的水平高得多,他获胜的场数刷新过世界纪录。”这个AI项目的经理伦特·阿霍诺夫(Ranit Aharonov)表示。
这场辩论赛是在IBM Think大会上举行的。“AI表现得很棒,这也是一个很好的展示,但我们应该专注于如何利用这种技术,开发出具有商业可行性的东西出来,” 阿霍诺夫说。
他们的设想是用它来帮助公司理解员工或客户的观点,或帮助媒体和政府吸引公众讨论有争议的问题。“我们快要完成第一个用例了,” 阿霍诺夫说。
这是因为Debater项目背后的技术,看重的是现实生活世界中的复杂和细微差别,而不是棋类游戏中的那种非赢即输。
“我们正走出AI的舒适区,进入更加说不清道不明的地带,”斯洛尼姆说。(腾讯科技编译Kathy)