在人工智能和新闻的结合上,国外媒体已经飞起来了?
编者按:本文来自微信公众号“刺猬公社”(ID:ciweigongshe),作者陈璐、刘晨阳,36氪经授权发布。
本文为 AI+News 系列报道,系列一:在人工智能和新闻的结合上,国内媒体到底做得怎么样了?
从没有任何一个时代比如今这般更让媒体人如履薄冰,内部变革困难重重、外部环境动荡更迭、核心生产力更存在被彻底颠覆的可能性。正如海水覆盖着海底千沟万壑,让表面平静蔚蓝一样,在社会环境看似平缓的变化下,同样掩盖着无数的阵痛、失败和探索。
但我们相信,任何变革和进步的根本,只会发生在生产力和产业的深入结合上,新闻行业也一样。为此,刺猬做了关于AI+News的专题报道,希望通过观察人工智能在新闻领域的应用,引起自己和读者对当下的环境的思考。
这是该专题的第二篇,国外媒体在技术辅助新闻报道上,远比国内靠前。
机器人写稿2.0
《财富》杂志说:“现在只要随便伸手抓来一家科技公司,都会发现它已经涉足了AI界。”如果把“科技公司”换成国外媒体,这句话同样成立。相较于国内媒体的试水《在人工智能和新闻的结合上,国内媒体到底做得怎么样了?》,入局较早的国外媒体在“人工智能+新闻”领域的探索时间更长,探索结果也更为深入。在这篇稿件中,刺猬君将试着从新闻生产流程入手,观察外媒在将人工智能和新闻实验室结合时做的种种尝试。
提到人工智能在新闻业的应用,表现最出色的当属机器人写稿,比较早将这一方式应用于实践的是一家名为“叙事科学”(NarrativeScience)的服务公司。该公司早在2010年就推出了一款名为Quill的写作软件,能从不同角度将数字转化为有故事情节的叙述文。Quill曾被用来撰写电视及网络上棒球赛事的比赛报告,福布斯网站曾使用NarrativeScience的技术自动制作财报和房地产相关报告等。
在此之后,包括美联社、《华盛顿邮报》、《洛杉矶时报》等在内的很多国外媒体都先后加入了这种尝试。
1.美联社:机器人写稿,还要转换为广播
2014年7月,美联社(AP)与科技公司AutomatedInsights(简称AI)公司达成合作,使用他们的Wordsmith平台自动编发企业财报。具体流程是每当公司发布财报,Automated Insights会自动抓取收到的财报,基于美联社预先编辑好的写作结构,几秒钟之内生成一篇150-300字的新闻快讯。这套系统每季度能生产近4000篇财报新闻,而在此之前美联社的编辑们每季度只能写出400篇财报。
除了更大的数量和更快的速度,WordSmith的自主“学习”能力同样惊艳。短短三个月,该系统就已经自主掌握了新闻写作的基本规范,其差错率比人类职业编辑更低。写作机器人在改变数量的同时也在优化稿件质量。
到了2015年,美联社将自动化新闻报道的范围扩大到了体育板块。今年6月,美联社尝试与MLBAM(美国职棒大联盟媒体)合作报道棒球比赛,将观众习以为常的比分式报道转换为文字故事。
作为最早将人工智能运用到新闻写作之中的媒体之一,美联社也在持续探索新的领域。今年10月,美联社战略企业发展部高级副总裁JimKennedy,在接受哈佛尼曼新闻实验室(TheNiemanJournalismLab)记者Joseph Lichterman的采访时,透露了其人工智能应用的下一个方向:将文字新闻自动转换为广播。该项目的设想是,开发团队集中于一项特定的体育项目,制作出将文字转换为广播的模板,在此基础上开发出适用于这一转换的算法。Kennedy还透露,与外部公司合作开发从文字到广播的识别系统可能要耗时6个月,目前的设计样品仍需专门的编辑进行审核。他们的最终目标是让智能技术达到不需要人工编辑审校即可发布的水准。
2.洛杉矶时报:专注突发与犯罪
2014年3月,美国加州发生4.4级地震,《洛杉矶时报》成为当时最快在网站报道该消息的媒体,从撰写到发布仅用了3分钟。该条新闻出自机器人之手,《洛杉矶时报》地震新闻自动生成系统在收到美国地质勘探局发来地震信息的第一时间,迅速将数据内嵌至系统模板中,生成突发新闻。
除了写地震突发的机器人,《洛杉矶时报》还有一台专门搜集洛杉矶当地自杀新闻的机器人(2010年起),依靠人工智能建立起了一个犯罪库,使编辑追踪新闻变得更容易。但从时间上看,《洛杉矶时报》在人工智能辅助新闻报道的尝试来得更早,但机器人的作用集中在整合、嵌套消息上,尚未涉足更深入的领域。
3.华盛顿邮报:更多体裁
今年的里约奥运上,《华盛顿邮报》也派出了机器人团队进行赛事报道。写稿机器人Heliograf从体育数据公司Stats.com和美联社获取奥运会的最新信息,并自动组成短消息作为即时新闻发布,比如奥运会的积分榜、奖牌榜以及其他以数字为核心的报道。
奥运会结束之后,Heliograf又投入到了对美国众议院、参议院和州长等大选新闻的报道当中,利用从美联社得到的数据和选举结果,实时撰写新闻并自动更新到邮报网站和社交媒体上。
负责《华盛顿邮报》新数字项目的杰雷米·吉尔伯特(Jeremy Gilbert)希望能够把带有人工智能软件的新闻内容“注入到”人力记者制作的内容之中,让机器人的新闻作品更像人力记者。
机器人编辑
既然机器人能写新闻,为什么编辑新闻不用它呢?《卫报》、《纽约时报》和路透社在新闻编辑流程中进行了一些尝试,难度、深浅不一。
1.卫报Open001:算法生成的报纸
2013年11月,英国《卫报》先和NewspaperClub合作发行了一份名为The Long Good Read的新报纸,让Newspaper Club开发的一款在线页面布局工具试了试自动排版。
之后,《卫报》于2014年推出了一份名为“#Open001”的纸质报纸,报纸内容几乎完全由算法生成。机器人在对社交网络上的热门分享进行统计分析后,基于此进行内容筛选、编辑与排版。作为试验性产品,#Open001 每月仅印刷 5000 份,而且只针对媒体机构和广告机构发行。
2.纽约时报Blossomblot:找爆款
《纽时时报》数字部门的科学团队研发机器人Blossomblot的初衷是为了解决一个问题:在《纽约时报》一天推送的300篇文章中,哪些真正适合推荐到社交媒体网站?Blossomblot通过对社交平台上推送的海量文章进行大数据分析,能够预测哪些内容更具有社交推广效应,并帮编辑挑选出适合推送的文章和内容,通过机器学习甚至可以独立制定标题、摘要文案、配图等。
虚拟编辑Blossomblot上线后,《纽约时报》内部统计数据显示,经过Blossomblot筛选后自动推荐的文章的点击量是普通文章的38倍。
3.纽约时报R&D Editor和路透OpenCalais:文章标签自动化
2015年7月,纽约时报 R&D实验室开发了一款用来自动标记文章的机器人,编辑写稿时,机器人会自动弹出文章可以采用的标签和关键词,为新闻编辑部提供了一种创造性的收集内容的方式。
这与路透Calais系统的操作原理类似,Calais会从各类文本类型中找出元数据,通过连接内部的资料库实现文本阅读和分析。当记者或编辑在系统中键入内容时,每个词都会被系统记录和学习,并随时与系统数据库进行比对,筛选出关键词和重点内容。当记者完成写作时,机器人可对记者建议的注释进行简单地审查。
人工智能的触角还伸向了哪里?
除了写作和编辑,新闻生产的过程还包括海量数据分析、新闻事实核查、新闻线索收集、和新闻交互使用。国外媒体已经开始在这些领域应用人工智能技术。
【海量数据分析】
1.Mashable:让Velocity成为预言家
Mashable是美国的一家知名互联网新闻博客,关注各大社交媒体和科技公司的新闻动态。今年2月,Mashable的执行董事Ben Maher在出席活动时称,Mashable如今开始运用人工智能技术发现故事,“主页”已死,媒体们应该努力去吸引现代用户。
为吸引用户,Mashable启动了一个名为Velocity的数据分析工具平台,通过分析链接识别文章的传播趋势和可能存在的爆点,除此之外,Velocity还可以帮助编辑们发现“饱和点”,如果一个事件的分享率达到95%,编辑就不再投入关注,如果没有,编辑们则可以考虑为其再添加“一把火”。
2.路透社+Graphiq:人工智能数据库
今年8月30日,路透社宣布与语义技术公司Graphiq合作,为有合作关系的新闻媒体及发行商提供Graphiq庞大的可视化数据库,这一数据库基于智能算法进行实时更新。
据Graphiq的副总裁Alex Rosenberg介绍,他们的解决方案是预先假设哪些事件将被报道,之后人工智能可在极短的时间内从数据库中抓取数据,建立可视化图像,然后打包这些图像与所做的报道匹配。
举例来说,如果你准备写一条鳄鱼攻击人的新闻时,Graphiq的人工智能系统已经把该事件基于历史数据的可视化内容生成完毕,在提升内容信息量的同时也为记者节省了大量时间。
【新闻事实核查】
刺猬君在之前的文章《这是美国大选辩论最坏的时代,这是事实核查新闻最好的时代?》里曾介绍了事实核查新闻的生产流程。以美国的PolitiFact网站为例,网站记者(研究员)和来自不同新闻机构的合作记者一起人工挑选内容进行核查,记者和编辑需要随时关注、寻找、筛选核查的内容与对象。但有不少国外新闻机构开发出了应用于新闻核实的机器人。
《华盛顿邮报》2012年开发了一个叫“Truth Teller”的应用程序,用以自动对新闻内容进行即时核实。不过,这一技术之后的发展之路却略显坎坷。2013年9月,Truth Teller推出了测试版,但核实能力依旧非常有限:《邮报》团队需要在实操过程中教Truth Teller假话的无数种说法,同时,Truth Teller的语音识别系统还会不时出现转码错误。此后,Truth Teller的热度便慢慢退去。
不少人对新闻自动核查的可行性提出了疑问,但这没有停住媒体机构为此进行尝试的脚步。英国的一家事实检查机构 Full Fact今年年初发布了一个测试版的监控系统,从几十个英国新闻网站(BBC、卫报等)搜寻信息,自动分析英国议会记录和其他一些内情,目标是捕捉每个谣言的生命周期,进而粉碎这些谣言。Full Fact下一步的计划是以概念验证的方式进行自动化地检测和核实统计出来的报道,在确保数据机器可读的情况下提高人工智能的情景分析能力。这里“统计出来的报道”是指一些通常情况下可识别的报道,例如「X 认为」就是一种很常见的可统计的报道,计算机可以识别这些模式,然后检查公共数据。
Full Fact 的主任 Will Moy对新闻自动核查表达了乐观的态度。他认为事实核查的四个阶段(在信息来源中监控媒体、确认关于事实的报道、检验真假和公布核实结果),每个阶段都可能实现自动化。
【新闻线索搜集】
今年4月,Facebook Messenger面向所有开发者推出聊天机器人Chatbot,入驻的媒体均有开发权限。目前,大多数媒体开发的机器人主要用于新闻内容推荐,比如华尔街日报、卫报、CNN等,但一些媒体的聊天机器人也承担起了收集新闻线索的任务。
《华盛顿邮报》开发了一个叫Feels的聊天机器人,在美国大选期间向用户收集选举相关数据,以捕捉美国选民在选举前3周的倾向。Feels每天还会提供5个emoji,让用户选择最符合自己倾向的表情。
同样地,Buzzfeed也希望 Messenger 上的用户通过Chatbot给它提供新闻素材。
当用户打开与Chatbot的聊天界面时,它会告知用户它在为俄亥俄州的克利夫兰市周一举办的美国共和党代表大会搜集新闻素材并开始询问用户一系列问题:你关注这条新闻吗?如果你住在克利夫兰市,你会围观还是会抗议这次大会?你是否愿意发些现场的图片或视频?这些问题都有三个预设的答案,用户只需选择其中一个就好。最后,ChatBot 都会要求用户发一个 emoji 表情来描述对这次大会的感受。
BuzzFeed后方的新闻编辑部有一个专门运营ChatBot的团队,编辑们通过与现场记者的沟通,实时更新消息形成良性的反馈循环。Buzzfeed 网站主编本·史密斯(Ben Smith)称,Chatbot是新闻报道的补充,它能帮助Buzzfeed同时跟很多人沟通。
【新闻交互应用】
外媒的聊天机器人除了用来搜集新闻线索之外,最常见的功能便是与用户进行交互。其中比较典型的代表便是Quartz自己研发的聊天机器人和CNN在Facebook messenger上开发的聊天机器人 。
1.聊新闻的Quartz
数字商业新闻网站Quartz在今年2月上线了以人机对话的方式推送新闻的客户端。与传统的看新闻不同, Quartz界面是个单纯的对话窗口,打开后Quartz会用聊天式的口吻向读者推荐新闻。当读者看到感兴趣的话题时,可以点击窗口下面的选项进行追问,了解更多细节。Quartz推送的所有内容经过人工编辑实现选择和编辑,用户与Quartz的互动则是由机器算法完成。
Quartz副总裁兼执行主编扎克•西沃德(ZachSeward)在接受采访时说,聊天式新闻大大提高了用户粘度,用户停留的时间变长了。不过这类新闻产品最大的挑战是找到适合聊天的新闻类型。
2.CNN聊天机器人
作为Facebook Messenger聊天机器人的首批体验者之一,CNN也对交互有不小的兴趣。除了每天向用户推送头条新闻外,CNN的聊天机器人还在界面下方设置了读故事、了解梗概以及向机器人提问三个选项。
提升机器人与用户交互的流畅度需要增强机器人识别文本和语义的能力。CNN下一步的计划是与Outbrain进行深度合作,让机器人能够熟练对相同的词语在不同意境内进行意义的转化。
科技公司抢镜停不下来
人工智能技术在外媒新闻生产过程中的应用已经相当广泛,不过同国内一样,由于人工智能与计算机、互联网等技术一脉相承,那些拥有强大技术基因的科技公司切入内容市场优势十分明显。比较典型的是Facebook和微软。
作为全球最大社交媒体平台(拥有超9亿用户)的Facebook自然不会错过对机器算法的尝试。今年8月,Facebook解散了“热门话题(Trending)”团队,将热门话题的编辑、推荐和排名全部交给机器算法,筛选依据是该话题的相关文章和贴文数量。
但Facebook在机器算法上的尝试可谓饱受争议。2014年,外界出现了批评用户消息流中并未出现足够多有关迈克尔·布朗枪击案的报道,压力下Facebook不再坚持纯算法的新闻筛选方式。2015年5月,Facebook又面临用户对编辑团队存政治偏见的指责,之后决定调整人工编辑在审批热门话题方面的作用。今年8月,Facebook热门话题人工编辑的工作不再是提炼新闻要点或者选择新闻话题,而在于训练他们背后的这些算法。今年更是被爆出不断推送假新闻的情况。
看得出来,虽然AI进入新闻编辑部势不可挡,但内容完全算法化存在的风险也不小,最明显的就是因算法识别不力而导致的假新闻泛滥。
另一边,微软在今年5月发布的最新新闻应用——NewsPro 2.0加入了“新闻机器人”,功能也同大多数媒体的聊天机器人一样,主打新闻推荐。它会根据用户指令每次推送三条相关新闻。比如输入“Give me news”之后,NewsPro会给用户推送个性化头条。
瑕不掩瑜,众多的尝试给出了极为珍贵的经验
与国内相比,国外媒体的写作机器人有三点不同:一是其覆盖的新闻种类不只局限于数据来源清晰的体育报道和企业财报,还包括报道社会热点和突发新闻;二是数据来源更广,国外新闻机构不仅拥有官方数据库,还打通了各种各样的企业数据,比如《华盛顿邮报》与体育数据公司Stats.com、美联社与MLBAM合作等;三是外媒对AI技术的应用已经超越了模式化写稿的1.0阶段,他们正在探索如何提高机器人的自动化程度以及如何使人工智能拥有更接近人力记者的写作水平。
此外,外媒的人工智能技术在新闻编辑、数据分析、线索收集、新闻核查与形式交互创新等方面的进展已经取得了不错的成绩,不过也暴露出不少问题,比如核查的不准确、交互的不流畅、算法识别不力导致的假新闻、算法按兴趣自动推送带来的观点极化等等。
哥伦比亚新闻学院的数据专家、记者JonathanStray今年在《哥伦毕业新闻评论》上发表了一篇关于人工智能与新闻业的文章,标题是《赛博纪元:人工智能将协助人类彻底变革新闻业》。文中表示,人工智能的巨头迄今都在忽视新闻业,谷歌正在开发自动驾驶汽车、图像理解和健康应用程序;IBM 的 Watson 部门已投资 10 亿美元在“认知计算”上,希望将软件销售给法律、医学、营销和智能方面的从业者。但新闻业不在他们的列表中,因为这一市场还不够大。
但我们必须看到的是,AP、路透社等一些新闻机构如今每个月会发出上千篇计算机自动编写的稿件,这无疑是一个巨大的进展。但今天的写作机器人在语境理解和趋势分析上仍未表现出令人惊艳的一面。一篇好新闻依旧需要人类记者的见解和分析。
以往,我们在谈人工智能对新闻业的变革时,总是把“取代人类”几个字挂在嘴边,但在看完国外媒体的人工智能实践后,一个显而易见的事实是:现阶段人工智能的所有新闻实践背后都离不开人,无论是简单的模板内容填充还是海量数据抓取、新闻自动化核查还是聊天机器人互动,其背后都需要人类设计智能系统和人工训练机器人。在未来很长一段时间里,人工智能与新闻业的结合更多地将是交互式的结合,完全自动化的新闻报道仍将面临不小挑战。
(金凯娜对本文亦有贡献)
参考文章:
1、4 Examples of AI’s Rise in Journalism (AndWhat it Means for Journalists)
2、AI is already making inroads intojournalism but could it win a Pulitzer?
3、The age of the cyborg
4、BuzzFeed’s newest political reporter is a bot
5、1年时间,机器人如何席卷英美编辑室
6、美联社黑科技:机器人写稿,还要转换成广播
AI+News 系列报道(一):
在人工智能和新闻的结合上,国内媒体到底做得怎么样了?