机器人25秒写出九寨沟地震报道,记者这个职业还有希望吗?
编者按:本文来自微信公众号 “刺猬公社”(ID:ciweigongshe) ,作者石灿
8月8日21时19分,四川九寨沟地震,机器人用25秒写了全球第一条关于这次地震的速报,通过中国地震台网官方微信平台推送,全球首发。
这篇标题为《四川阿坝州九寨沟县发生7.0级地震》的速报全文585个字,在8月8日21时37分15秒自动编写。
速报内容包括速报参数、震中地形、热力人口、周边村镇、周边县区、历史地震、震中简介、震中天气、产出说明和5张图片。
“四川阿坝州九寨沟县发生7.0级地震”速报
写这则速报的作者为“地震信息播报机器人”,它是国家地震台网研发的智能机器人。
这不是它第一次露面,早在2016年5月四川绵阳地震期间,它就用6秒钟写下560字速报,整个过程自动写作,自动发布,无人介入。
很快,一条题为《绵阳安州发生4.3级地震》的新闻开始传播开来。内容包含地震参数、震中地震历史信息、地震周边乡镇的基本情况、地震所在县的行政情况,还有两张震中地图,图文并茂,跟这次情况一样。
据了解,“地震信息播报机器人”并不是人们想象中的实体“机器人”,而是一套能够执行命令的程序。当地震发生后,这套系统会启动工作流程,取标题、发布图片、写地震参数……将这些步骤逐一展开,在最短的时间把速报写出来。
8日当晚,中国地震台网官方微信发出第一条速报后,截至9日下午6点32分,又连续推送了14条关于地震的速报,均为机器人操盘,最快出稿速度为5秒。
排列以速报推送时间为基准
速报的数据地震参数,如震级、震源深度等信息来自地震台网。其他背景数据来源不一样,如震中的简介、震中所在地周边乡镇、村落等情况,有些是检索的,有些则是之前就储存在机器人系统里。
自中国地震台网微信平台今年6月29日上线以来,共发送了68篇机器人撰写的速报。
在地震报道领域,机器人早有所作为。由《洛杉矶时报》内部员工肯恩·斯昆克开发,并于2011年投入使用的Quakebot是地震领域自动化新闻的鼻祖和标杆。
2013年3月,Quakebot因为第一个报道南加州发生的4.4震级的地震而迅速引起关注。2014年3月17日,美国洛杉矶发生4.4级地震,Quakebot用3分钟完成了相关报道的写作和发布。
四川九寨沟地震发生后,“地震信息播报机器人”又一次引发了人们的关注,机器人有一天会替代人类记者吗?有这几个问题你需要了解。
机器人目前擅长的写作领域:财经、体育、自然灾害
机器人参与新闻工作,最早可以追溯到2001年谷歌实现个性化新闻推荐,那年,谷歌开创了用机器选编新闻的先河。
可实际上,机器人新闻是“自动化新闻”的通俗说法。继2014年7月美联社引进“机器人同事”后,全世界的新闻编辑室纷纷引入自动生成新闻技术。
《纽约时报》《华盛顿邮报》《洛杉矶时报》《卫报》和路透社等西方媒体都走上了自动化新闻发展的道路。
国内,直到2015年9月,腾讯财经的机器人Dreamwriter才正式出道;同年11月,新华社推出“快笔小新”,主打财经新闻;去年,第一财经发布智能写稿机器人“DT稿王”。
截至8月8日下午3点03分,Dreamwriter在当天共发布了两篇新闻
不难看出,自动化新闻格外擅长于财经领域,不过,它在体育领域也毫不逊色。
以“快笔小新”为例,它供职于新华社体育部、经济信息部和中国证券报,可以写体育赛事中英文稿件和财经信息稿件。多领域同步发展,难不倒自动化新闻。
上述两个领域和地震领域有着几个共同点:其一,数据繁多,程序复杂,工作繁琐,需要花很多精力对数据进行分析,而处理数据是算法的强项;其二,有相对固定的新闻模版,较为程式化,题材重复性高;其三,这类文章大多不需要大量采访。
所以,记者到底会不会因为机器人而失业?这是有可能的,但不是所有领域。
《洛杉矶时报》的机器人也误报过地震新闻
2015年,NPR(美国国家公共电台)让一位资深商业记者与写稿机器人比拼写新闻稿,双方就一家公司的最新收益报表出来后,第一时间进行写作。
最后,机器人花了2分钟完稿,记者花了7分钟。在质量上,机器人的稿子获得912票支持,记者获得了9916票支持。
你觉得哪篇是记者写的新闻稿?
将记者与机器人的新闻稿做对比后发现,记者的新闻稿以语言丰富取胜。但这并不是说机器人的新闻稿就很差,它的新闻稿反而更加凝练和简明。
机器人稿件中的这些特征与“机器人新闻”的工作原理密不可分。
简单来说,新闻写作可以分为两类,一是用模板式写作,直接往框架里面添加内容。二是更复杂化、人性化、文学化的新闻。机器人写稿属于第一类。
“快笔小新”发稿系统研发团队成员、技术局高级工程师熊立波在接受媒体采访时说:“机器人写稿流程分为数据采集、数据加工、自动写稿、编辑签发四个环节”。
技术上通过根据各业务板块的需求定制发稿模板、数据自动抓取和稿件生成、各业务部门建稿编审签发“三步走”来实现。
新华社机器人发稿系统后台有500到600个模版,可以根据不同的要求,呈现不同的稿件。
目前新华社机器人发稿系统运营维护仅需4到5人,平均一天稿件签发量在100条左右。
总而言之,一条机器人新闻的顺利诞生,首先需要清晰、准确、结构化的数据,当数据质量较差时,新闻的报道质量也会受到影响;其次,机器人新闻的报道领域局限于题材重复的新闻故事;最后,机器人现阶段依旧离不开人类干预。
目前需要人类干预的环节包括:制定算法、提前撰写新闻模版(语句、段落或是整篇报道)、最终核实环节,等等。
这也意味着,一旦脱离了人类的干预和核实,机器人新闻的准确性可能面临巨大的挑战。
当地震或是其他自然灾害发生的时候,附近地区的读者最希望能够快速、准确地知晓诸如破坏程度、波及地域、时长等信息,以便及时逃生或是做好避难准备。而一旦地震报道失实,则可能造成不可估计的严重后果。
即便是地震机器人新闻的鼻祖Quakebot,仍然多次误报地震信息。
2015年3月,南加州的地震仪检测到了日本、阿拉斯加主要的地震信号,美国地质调查局错误地将其报告为发生在加州的、震级范围从4.8到5.5的地震。但地震并没有发生,更没有人感知到地震。
尽管如此,Quakebot仍然发布了这三个假地震的报道。
“机器-人类”联姻模式,或将成为新闻界的未来
除了准确性,目前机器人新闻还面临着“可读性”的问题。西方多个学术研究的结果显示,机器人新闻的可读性不如人类记者撰写的新闻。
2014年,瑞士卡尔斯塔德大学的克里斯特·克勒瓦在受访者不知道文章来源的情况下,观察和分析人们对新闻报道的质量评估。
研究结果显示:自动化新闻在可信度方面的排名比人类写得高,但在可读性方面明显低于人类。
具体而言,人类记者撰写的新闻连贯程度高、撰写质量高、更清晰、阅读起来更为愉悦。而自动化新闻则相对无聊,更为描述性、信息量更大、更为可信和客观。
不过,随着算法的迭代,机器人新闻的可读性正在日益朝人类记者的水准逼近。2017年,西方学者安德里亚斯·格雷费和马里奥·海姆,对自动化新闻的接受度和可读性进行了量化研究。
实验的研究结果显示:自动化新闻和人类撰写的新闻在五个与可读性相关的指标中,有四个没太大差别。
即便如此,机器人新闻仍旧因其算法的局限,难以完成诸如深度访谈、深度分析等人类记者擅长的工作。
这也解释了为什么,就目前的情况来看,机器只会与人类产生更加密切的联系,而人机协作是未来发展必然趋势的原因。
机器人对数据非常敏感,它可以对基础的数据类新闻进行分析和写作,节省记者的时间,降低媒体的成本,提高媒体的效率和收益。
需要与人打交道的深度报道,主力是记者,在操作的过程中机器人会帮助记者解决掉很多问题,比如语音转录、数据报表分析、制作图片等等。
写稿机器人归类于AI领域,AI威胁论近年来从未消停过。在刚刚过去的7月里,马斯克就提出了人工智能威胁论,他表示在30年之内AI就会超越人类的智慧,后果让人担忧。话还未落音,扎克伯格在直播时驳斥了马斯克的观点,再次强调AI和谐论。
在AI威胁论同样盛行的新闻媒体领域,一部分媒体人对写稿机器人的出现表示担忧,但更多的人觉得,机器人并不会取代记者,相反会成为记者的好帮手。
所以,在未来,机器人和记者相互协作,才是主流趋势。即使机器人抢了在某些领域工作的人的饭碗,说到底也是为了推动整个社会的前行。
(贾宸琰对此文亦有贡献)