专访IBM:AI辩论机器现在是怎么做的,以后能做什么?
IBM人工智能产品Project Debater与辩手Dan Zafrir进行“较量”
腾讯科技讯 在上周,IBM推出的名为“IBM Project Debater(下文也称Debater)”的AI机器在辩论赛中大胜以色列国家辩论赛的冠军,并引起了业界轰动。
与此同时,诸多业界人士也对Debater的核心技术与商业价值表出疑问:Debater究竟是如何运作的?使用哪些机器学习技术?是如何实现精确的语音语义识别和自然语言处理的?相应的数据训练集又是如何组织起来的?腾讯科技独家专访了IBM Project Debater相关团队,对这些诸多问题进行了逐一解答。
IBM Project Debater 通过给定主题搜索论点
在与人类辩手的这场辩论中,主题或论点来自维基百科中的常见论点。
只要给定Debater一个主题,该系统就能够进行搜寻大量的知识,寻找最相关的观点和证据来支持或反驳主题。随后,机器会挑选出最有说服力、最具多样性和支持最完善的论点,并对这些论点进行编排,从而形成一段完整且有说服力的叙述。
Debater 可通过结构来发现正反两方的论点,不偏向任何一方。只要语料库中有充足的主张和证据,Project Debater 可就任何主题进行辩论,即可作为正方,亦可作为反方参与辩论。
IBM Project Debater涵盖海量的语料数据库
那么针对主题的这些语料库都是怎么得来的呢?IBM Project Debater负责团队表示:Debater 采用了IBM Watson Text to Speech 和 Speech to Text API语料库,其涵盖了3 亿多个信息来源,包含 2011 年以来全球商业、法律、学术和政府机构等领域的专业人士所使用的主流报纸和杂志中的文章(包括维基百科)。
为了训练机器对语料库数据上的深度学习,IBM开发了几个基准数据集。其中一些数据集专注于计算论证任务,而另一些则与更广泛的自然语言处理(NLP)研究社区相关。其中包括:19,276 对根据可读性打分的维基百科词条 、5,000 个带有情感注释的习语、3,000 个带注释的句子、2,394 个关于 55 个话题的分类论点、60 篇专业辩手关于争议性话题的演讲稿(包括草稿和不带修订的版本)。
此外,训练过程中还加入了人工的参与。Debater团队负责人对此表示:“在训练过程中,我们与十几位辩手开展合作,他们有的是非常专业的辩手,有的在大学期间就参加过辩论赛。”
IBM Project Debater具备三大机器学习能力
为了开发 Project Debater,IBM 研究团队为该系统赋予了三大机器学习能力:
首先是在数据驱动下的演讲稿撰写与表达能力,以便于计算机能够理解大量语料库,使机器能够根据主题撰写结构良好的演讲内容,并清晰且有针对性地表达出来,甚至还会适时地展现幽默风趣。
其次是听力理解能力,能够识别长段连续口语中隐含的重要概念和观点。 另外,团队也会给机器进行模拟一些困境,比如说通过独特的知识表达方式来模拟具有人类争议和困境的场景,使系统能够根据需要提出有原则的论点。
IBM Project Debater将首先适用于两大商用场景
Debater团队表示,在未来,Project Debater的核心技术可能会应用在金融顾问和律师等职业中。
金融分析师可以通过使用机器的优缺点分析技术,从而支持或反对金融分析师所思考的金融投资选择。而律师则通过 Project Debater 的汇总技术来寻找相关的案件和观点主张,以此了解相关内容与手头案件的关系,研究可在法庭上可使用的较为合适的法律先例。
虽然从核心技术和商业模式来看,Debater的未来应用潜力较大。但我们需要注意的一大问题是,目前有部分媒体记者和分析师认为,虽然整体来看,人类辩手表达更好,但是AI传递的信息量的丰富程度优于人类辩手。并且在上周的辩论过程中,AI系统确实也做出了一些“疯狂”的断言。
总而言之,IBM Project Debater是否能真正具备公认判断力并且落地商业化,不仅需要行业的真正实际应用认可,还需要更多AI相关技术的突破。IBM Project Debater作为IBM在AI领域的又一次尝试,开创了“计算辩论”(Computational Argumentation)的领域,其技术积累的经验可能会让IBM未来在全新的人机交互界面和“B To B”商业项目的拓展上,拥有了更多可能性。
腾讯科技 执笔 | 李海丹 审核 | 孙实