25秒发布九寨沟地震消息,写稿机器人速度逆天
8月8日晚,四川九寨沟发生了7.0级地震,一时间,各家媒体争相报道。然而,据亿欧了解,最先发布该消息的竟然是中国地震台网的一个写稿 机器人 ,7.0级地震报道用时25秒,其余余震消息用时5秒。
我们先来看看这篇22秒完成的报道里都写了什么:速报参数+震中地形+热力人口+周边村镇/县区+历史地震+震中简介+震中天气(共543字),除了对此次地震的详细原因分析,这篇报道可谓是一应俱全,成天埋头敲键盘的小编们再怎么样也不能在半分钟之内完成这样的编写工作。
机器人写稿早已经不是什么新鲜事,中国地震台网早在2015年下半年就开始了相关的研发工作,2016年,写稿机器人投入测试,2017年,已经可以接入各种媒体和社交平台。这款机器人会根据本地数据网络以及接口调用、空间分析等多种技术自动地完成地震信息发布,并通过新闻客户端、微博、微信、短信、邮件向公众快速地传播消息。
当然这并不是写稿机器人的起源,写稿机器人开始于2009年,在美国的职业棒球大联盟季后赛上,一款名为StatsMonkey的人工软件超过人类记者的速度,率先完成一篇机器稿件,当时在街头巷尾争议四起。在2010年,一家名为NarrativeScience的公司推出了名为Quill的写作软件,它可以完成数字内容的文章化,自动生成如财报、比赛报告等相关文章,可以说是写稿机器人的雏形。
随着越来越多的媒体开始迈入智能化生产阶段,机器人写稿也不再是博人眼球的噱头。小编现在来给大家盘点几款国内外有代表性的写稿机器人:
1、 腾讯 “DreamWriter”
腾讯是国内最先进行写稿机器人研究的公司,2014年12月开始筹划并建立数据库,2015年3月正式启动机器人写作项目,经过半年的开发和测试,于2015年9月正式上线并取名为“DreamWriter”。
针对机器人所写的稿件,腾讯成立了一个专门的安全管理平台进行内容风险管控:第一轮,机器写作时会单独做一个算法和规则,以此判断机器写得是否符合规范;第二轮是安全审核;第三轮才能正式发布。
2、 新华社 “快笔小新”
2015年11月7日,84岁的新华社迎来新员工“快笔小新”,开启了国内中央媒体机器人写作的先河。“快笔小新”供职于新华社体育部、经济信息部和中国证券报,可以写体育赛事的中英文稿件和财经信息稿件。
比如“快笔小新”在中国足球超级联赛报道的写稿测试中,能够自动抓取比赛数据,生成中、英文数据消息,包括每轮比赛的成绩公报和积分排名。在财经新闻方面,“快笔小新”可以从一句话的报盘或者一段话的公司财报入手,根据“行情触发”,写出“站上/跌破××整数点位”的快讯。
3、 今日头条 “Xiaomingbot”
在众多写稿机器人中,今日头条“Xiaomingbot”有着最接地气的中文名——张小明。张小明由今日头条实验室研发,可以通过两种文本生成技术产出新闻:一种是针对数据库中的表格数据和知识库生成自然语言的比赛结果报道,即简讯;另一种是利用体育比赛文字直播精炼合成比赛过程的总结报道,也就是资讯。
张小明在前几版机器人上做了几点创新,主要包括自适应与自动配图。自适应是指根据比赛选手的排名,赛前预测与实际赛果的差异,比分悬殊程度,可以自动调整生成新闻的语气,并使用带有感情色彩的词语,如“实力不俗”、“笑到了最后”等。自动配图是指通过自动选图技术,张小明可以给新闻配图,使其更加生动形象。
据了解,目前做奥运报道的机器人只有两家:除今日头条外,还有《华盛顿邮报》。
4、南方都市“小南”
2017年1月,南方都市的写稿机器人“小南”正式亮相,并以其“300字春运报道”走红网络,据了解,该报道的生成只用了不到一秒的时间。
与其他机器人“同行”的区别在于,小南聚焦的是民生领域的报道,并且它还能做到定制化输出。例如,今年的政府工作,网友比较关心哪些部分?房价?环境?交通?只要把关键词告诉小南,它就会在稿件生成过程中进行定向分析。
据小南的技术开发团队负责人万小军教授介绍,除了写摘要,小南将来还可以根据不同的稿件写综合报道,可以对已有的稿件进行改写,甚至试着写带有一定情感、观点和立场的报道。
5、百度“ 度秘 ”
其实百度度秘严格来说是为用户提供秘书化搜索服务的机器人,或许是为了追赶潮流,度秘曾推出“写诗”功能。2016年,在度秘1周岁生日时,它用受邀嘉宾的名字作出藏头诗并印在邀请函上,据某嘉宾称,度秘的诗写得很“规整”。
度秘写诗是通过写诗模型,预先规划每一行诗歌的主题,对用户的表达进行深度地分析、联想,逐渐强化诗歌与主题的相关性。同时,这个模型能自动学习对仗、押韵、比兴等写诗技巧。
6、《华盛顿邮报》“Heliograf”
在2012年年末,《华盛顿邮报》启动了名为“truth teller(吐真者)”的实时新闻核查项目。它能全程记录新闻报道中的文字、语音等信息,随后与“打假”数据库进行对比,一旦发现异常便会发出警报。但是《邮报》正式启动机器人Heliograf是在2016年爱荷华州第4届国会区席位的选举报道中,其报道流程如下:
首先由编辑为故事创建“叙事模板”,写入各种可能结果(例如“共和党人保持对众议院的控制”以及“民主党人重获对众议院的控制”)的关键短语;
其次,把Heliograf挂靠到某个结构化数据源上。例如,在报道选举时,就使用了VoteSmart.org(汇集了官员、候选人、立法、选举等的翔实信息)提供的数据;
然后由Heliograf识别相关数据,并将数据与模板中的相应短语进行匹配、合并,最终在不同平台上发布不同的版本。
7、美联社“Wordsmith”
美联社在2014年7月开始采用AutomatedInsights公司的Wordsmith平台自动编写企业财报,每季度可生成4000篇财报,相比此前编辑们每季度完成400份财报来说,效果提升巨大。
此外,这套 人工智能 系统还具有“自主学习”的功能,能够在三个月内自主掌握了新闻写作基本规范,降低错误率的同时改善了文章质量。Wordsmith的下一个方向是将文字报道自动转为语音广播。
除了上述应用,国外媒体还进行了“新闻聊天机器人”、“自动生成报纸”、“内容核查”等不同类型的尝试,可以说机器人在外媒的新闻编辑、素材收集、数据核查、交互创新等方面都取得了不同程度上的成果。
其实写稿机器人并不是指实体意义上的机器人,而是对机器自动生成文本、产出内容的一种抽象化命名。具体来说,写稿机器人多以特定的信息库为基础,通过一定的筛选、分析、运算等信息处理手段,将信息进行重新排列组合,并套用事先设置好的写作模板,输出新闻报道。机器写稿背后涉及到的技术包括数据挖掘、自然语言处理、机器学习、知识图谱、搜索等等。
机器写作一般分为三种形式:第一种是基于数字进行事实陈述及简单的逻辑分析,比如体育比赛的简讯;第二种是对信息源进行针对性的信息提取,再根据不同的规则把信息要点组合成一篇文章;第三种是单点内容的关联生成,可以关联专家对数据的解读和评论,生成有深度的文章。
不论哪一种形式,机器写作使用的范围都是很有局限性的,主要集中在体育赛事、新闻财经这两个领域以及对突发性事件的消息报道。很多人由此又产生了人工智能太“鸡肋”或者“人工智能威胁论”的想法,其实,单以写稿机器人为例,其更多的职能在于辅助人类。
机器人跟记者之间的关系其实是一种分工协作的关系。目前的机器人不具有逻辑思维能力,也不具有深度总结的能力,它只能把一个基本的新闻事实描述清楚。但是记者可以写深度报道,分析某一件事情的前因后果。
就目前的人工智能技术来说,机器辅助记者撰稿的实用性更大一些,可以运用人工智能手段对社交平台的文章进行 大数据 分析,推测哪类型内容更有热度,并为作者挑选合适的素材。此外,对新闻线索的收集也是人工智能发挥作用的一个方向。
未来写稿机器人一定是向着人性化发展,有独特的立场和态度,同时,要让机器学会推理和归纳,写出真正的深度报道。
版权声明
本文作者,亿欧专栏作者;转载请注明作者姓名和“来源:亿欧”;文章内容系作者个人观点,不代表亿欧对观点赞同或支持。