装了4亿篇档案的AI和人辩论谁赢了?IBM最强AI辩手首次登上《自然》封面
装了4亿篇档案的AI和人辩论谁赢了?IBM最强AI辩手首次登上《自然》封面
林志佳
· 刚刚
英国邓迪大学辩论技术中心的Chris Reed撰文认为,该研究开发了一个完全自主的计算机系统,能够与人类现场辩论。这一发现暗示,未来AI技术可以帮助人类制定并理解复杂的论点。
2018年,IBM研究院在美国旧金山展示首个能与人类进行复杂辩论的AI系统Project Debater,右侧是以色列国际辩论协会主席Dan Zafrir.(来源:IBM)
钛媒体3月18日消息,IBM研究院杰出工程师、Project Debater首席调研专家、人工智能专家Noam Slonim和团队发表了最新研究成果:一个名为Project Debater(意为“辩手项目”)的自主系统,已可以与人类专家选手进行体面且有意义的现场竞赛辩论。该系统能通过扫描储存了4亿篇新闻报道和维基百科页面的档案库,自行组织开场白和反驳论点。
虽然该研究中人类辩手被判定最终获胜,评分接近人类专业辩手水平,但作者认为,人工智能(AI)技术或具备参与复杂人类活动的能力。而该研究成果于今晨登上了顶级学术科学期刊《Nature》(自然)杂志封面。
本周《自然》杂志封面图
本论文通讯作者、IBM研究院杰出工程师Noam Slonim博士在接受钛媒体App采访时表示,作为有史以来首个人工智能系统,Project Debater可以与人类进行有意义的现场辩论,这一研究成果具有重大意义。同时,这也是IBM研究院掌握语言这一更广泛议程上的一个重要里程碑。
钛媒体了解到,本次研究中的IBM Project Debater是首次登上《自然》主刊封面。
事实上,AI发展到今天,应用层主要是计算机视觉(CV)以及听觉环境中。虽然可能存在像GPT-3这种文章变换语言新技术,但未有其大规模商用化应用案例。如今随着技术的发展,数据集的不断延伸,具有创造力的AI辩论场景成为了新的可能。
IBM的Project Debater项目由来已久。
1997年,IBM研发的超级计算机深蓝(Deep Blue)国际象棋比赛中击败了世界冠军加里·卡斯帕罗夫(Gary Kasparov),而象棋一直被认为是一种人类社会的高智力博弈。
Project Debater项目最早于2011年被提出,研究目标是让AI与人类进行现场辩论时应对自如。2018年,IBM Project Debater首次公开亮相,并与以色列国家辩论冠军Noa Ovadia和以色列国际辩论协会主席Dan Zafrir进行辩论。最终在“是否应该增加使用远程医疗”的其中一个议题中,Project Debater赢得了辩论,但在另一个“我们是否应该资助太空探索”话题中败给了人类。最终以各获一次胜利的结果展示给世人。
如今的这篇最新论文,更多是描述Project Debater项目中的体系结构并评估了其性能,还有使用AI赋能于辩论环境的技术过程。
具体来说,研究人员利用大量人工标记的高质量数据,通过训练深度神经网络 (DNN)和弱监督DNN来提高自然语言处理 (NLP)技术框架,从而取得和人一样的辩论能力,并通过文本转语音方式输出到外界当中。
论文中称,Project Debater辩论过程主要由以下四个模块组成:论点挖掘、论据知识库(Argument knowledge base)、论点反驳和论证构建。
- 论点挖掘:是基于约有4亿篇报道文章的大型语料库(来自 LexisNexis2011-2018 语料库),将文章分成句子,并用其中的单词、维基百科的概念、预定义索引语句等进行分类,然后使用神经模型根据这些句子代表相关论据的概率对它们进行排序;
- 论据知识库:旨在捕捉不同辩论之间的共性,通过论点进行手动编辑,分成专题,接着利用匹配方式将相关文本转换至语音中,在输出时包含鼓舞人心的引语、丰富多彩的类比、辩论的适当框架等;
- 论点反驳:更多是利用新的文本转语音(TTS)算法技术,为Project Debater提供清晰流利、有说服力的语言表达能力,包括添加双关语等,基于之前的语料,针对话题论点进行反驳。
- 论证构建:主要集成一个基于规则的聚类分析系统,将此前反驳的论点、论据串起来,对于每个集群确定一个主题,类似于维基百科、百度百科的概念,从而完成与对手的辩论、交流。
那么,AI辩手真的有能力和人进行主题辩论吗?
论文中提到,研究人员向人类组成的虚拟观众提供了辩论的文字稿,让他们在一系列话题(如资助学前教育)上对该系统与人类(包括专业辩手)和现有AI技术的辩论表现进行盲打分。尽管Project Debater在组织开场白方面的得分很高,明显优于其他系统,但最后并没能赢得辩论。
最终,Project Debater在78类辩题中获得接近人类专业辩手的平均评分。
Project Debater得分情况(来源:论文)
作者认为,赢得辩论比赛并非IBM Project Debater项目的研发重点,仅仅预示着一个新技术的开始。未来,这种AI辩手将有潜力在全球范围内协助人类制定日常的复杂决策。
“我们的辩论绝不是输赢,我们想证明AI系统和功能如何理解、生成自然语言,我相信我们做到了这一点,并且在此过程中学到了很多东西。”Noam Slonim对钛媒体App强调,AI辩手的作用,主要还是能够帮助人们推理,模拟人类困境,建立充分的论据,提供数据驱动的辩论内容的生成和表达能力,做出更好的决定。
在《自然》杂志附评论文章中,来自英国邓迪大学(University of Dundee)辩论技术中心的Chris Reed撰文认为,该研究开发了一个完全自主的计算机系统,能够与人类现场辩论。这一发现暗示,未来AI技术可以帮助人类制定并理解复杂的论点。
针对于该技术系统的难点和局限性等问题,Noam Slonim表示,Project Debater的数据语料依然较少,情感层面还无法与人类比拟。
他认为,有些问题人类本能理解支持某一主题,但对于AI来说,直接理解十分困难,大都依靠数据语料。如果Project Debater没有学习任何主题,其只能创建有说服力的描述,并非直接产生论点、论据等。他希望未来该系统可以覆盖更庞大的语料库,从而更好解决十分困难的辩论议题。
IBM方面透露,目前Project Debater项目已经实现了部分商业化,潜在应用包括金融顾问、律师、公共事务决策、学生助手和企业决策者等。在上周举行的格莱美颁奖典礼上,该AI辩手就流行文化话题展开了非打分式辩论。
Noam Slonim强调,Project Debater解决了一个重大的挑战,代表了AI技术的进步,而且拓宽(超出)了当前AI技术的舒适区,未来将能够参与更加复杂的人类活动。
(本文首发钛媒体App,作者|林志佳,编辑|盖虹达)
142篇资讯
20.1k关注
林志佳 认证作者
钛媒体记者。工作邮箱:zhijialin@tmtpost.com;交流请加微信:qq1393525745
最近资讯
- 装了4亿篇档案的AI和人辩论谁赢了?IBM最强AI辩手首次登上《自然》封面
- 再砸153亿元!联手深圳国资,中芯国际投建12寸晶圆厂,目标每月4万片
- 量子科技商业化寻路,资本造势但技术落地成难
想和千万钛媒体用户分享你的新奇观点和发现,点击这里投稿 。创业或融资寻求报道,点击这里。
敬原创,有钛度,得赞赏
-
钛粉92228 赞赏了
房产行业巨变后走向何方?居理买房网认为“深度导购”...
约3小时以前 -
钛粉36095 赞赏了
日均工作20小时、放弃未婚夫,那些逆流创业的女人们
2021-03-08 11:58 -
钛粉74059 赞赏了
孤独陈睿,放弃仪式抵抗
2021-02-25 00:16 -
钛粉35141 赞赏了
马云和他的三个“赌王”朋友
2021-02-22 13:09 -
钛粉12618 赞赏了
中国认知智能行业报告
2021-02-19 14:10 -
钛粉05059 赞赏了
陆奇万字演讲:中国经济形态与东南亚相似,创业创新易...
2021-02-09 11:08 -
钛粉69389 赞赏了
视频号是微信小游戏弯道超车的大好机会
2021-02-07 13:58 -
钛粉67426 赞赏了
我在抖音生产主播,投入一个亿,只挣两百万
2021-02-07 03:18 -
钛粉45533 赞赏了
在虚拟影院边看电影边社交是种怎样的体验?
2021-02-04 12:44 -
钛粉80055 赞赏了
能睡眠遮噪还能听音乐,1MORE ComfoBud...
2021-01-30 02:56 -
钛aB1IyM 赞赏了
“俗”人李子柒
2021-01-27 22:21 -
钛粉65171 赞赏了
敬“墨茶”一篮草莓,希望他在远方没有病痛和穷苦
2021-01-24 10:14 -
钛粉38610 赞赏了
网络平台涉黄屡禁不止,网络环境何时迎来健康未来?
2021-01-22 08:44 -
钛粉91023 赞赏了
巨头下注,播客虚火
2021-01-19 13:26 -
钛粉25879 赞赏了
中国下一个 “巨无霸”交易平台是什么?
2021-01-18 16:09 -
钛粉50426 赞赏了
谁会是中国小电厨电第一个千亿之王?
2021-01-13 16:45 -
钛a2I9ui 赞赏了
特斯拉降价,苦了自主新能源车
2021-01-11 23:04 -
蒙MYH 赞赏了
“喝”出万亿大市场:0糖更快乐,植物基出圈
2021-01-11 14:39 -
hU8dfb 赞赏了
中国电商的下一个绝佳机会
2021-01-05 15:37 -
钛粉76789 赞赏了
一个“傻瓜式”的SaaS开店工具,如何赚得千亿美金...
2021-01-04 14:16 -
钛粉68961 赞赏了
挑战海拉尔零下30度,体验一汽丰田双擎混动技术 |...
2021-01-03 16:31 -
钛粉18683 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:30 -
钛粉17696 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:23 -
h2WkpG 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:17 -
hwDjnH 赞赏了
2020年最后一天,社交平台Uki被Soul前员工...
2020-12-31 10:10 -
钛粉40181 赞赏了
石家庄,工厂子弟,和“万青”失去的十年
2020-12-25 14:33 -
钛粉89488 赞赏了
中高端MPV竞争,微妙平衡中寻找取胜之道
2020-12-18 16:41 -
钛粉89860 赞赏了
中高端MPV竞争,微妙平衡中寻找取胜之道
2020-12-18 16:32 -
钛粉15908 赞赏了
英特尔:硅谷文化的最后传承者 | 钛媒体深度
2020-12-15 13:47 -
钛粉77486 赞赏了
苹果:拨弄中、美、日命运的人
2020-12-07 08:11 -
钛粉02929 赞赏了
为何上海高院未按反垄断法第14条判决?
2020-11-25 15:39 -
Kris00135 赞赏了
“优爱腾”难题无解,长视频去向何方?
2020-11-24 12:04 -
钛粉88011 赞赏了
从荷兰回到张家口种树莓,他想用AI无人种植改变中国...
2020-11-19 17:52 -
钛粉39442 赞赏了
看完美国大选,是时候聊聊国内综艺的投票机制了
2020-11-09 12:59 -
在天空中自由翱翔的百灵鸟 赞赏了
透露一个共享办公的惊人事实:空置率70%-90%
2020-11-06 13:48 -
在天空中自由翱翔的百灵鸟 赞赏了
雷军:继续死磕硬核技术,小米2021年扩招5000...
2020-11-05 18:13 -
钛粉94592 赞赏了
手机用户“被5G”?三大运营商回应:办理4G业务建...
2020-11-04 21:12 -
在天空中自由翱翔的百灵鸟 赞赏了
详解互联网+医保新政:什么病能用?什么钱能报?
2020-11-04 16:51 -
钛粉18709 赞赏了
陈天桥再捐5亿支持中国脑科学研究,先在上海打造这个...
2020-10-23 20:30 -
钛aw26M5 赞赏了
深藏大山的汞矿遗址,孤身守矿的他,一辈子没有离开|...
2020-10-16 08:59 -
钛粉94035 赞赏了
海底捞涉嫌抄袭巴奴,4万亿餐饮行业什么才是核心竞争...
2020-10-10 01:25 -
钛粉15375 赞赏了
中国游戏的光荣与破灭
2020-10-06 13:44 -
钛哥儿 赞赏了
赵何娟对话薇娅:两个女人的知世故而不世故
2020-09-25 13:07 -
钛粉85193 赞赏了
以应用带产品,“自适应”工业级机器人Flexiv试...
2020-09-23 11:43 -
那只猫已转身不见 赞赏了
低房价、高收入,这些城市买房性价比最高
2020-09-18 16:36 -
一潭浑水 赞赏了
豆瓣评分4.8的《花木兰》,真的那么烂吗?
2020-09-12 13:24 -
钛粉59301 赞赏了
市值超四千亿,创造首富,农夫山泉为何这么“甜”?
2020-09-08 17:57 -
钛粉14259 赞赏了
到95后的茶杯里兴风作浪
2020-09-08 12:30 -
钛粉55117 赞赏了
中国APP出海“变形记”:再见工具,你好社交
2020-09-06 23:36 -
钛粉96933 赞赏了
银行与实体经济如何产融对接?产业要全面深入,数据需...
2020-09-05 09:42 - 查看精彩文章,打开钛媒体客户端
挺钛度,加点码!
- ¥ 5
- ¥ 10
- ¥ 20
- ¥ 50
- ¥ 100
支付方式
支付
支付金额:¥6
赞赏金额:¥ 6
赞赏时间:2020.02.11 17:32
账户【未登录】提示!
个人中心将无法记录并同步您的赞赏记录,
是否进行登录
分享文章
猜你喜欢
Oh! no
您是否确认要删除该条评论吗?
分享文章