今日头条的写稿机器人「张小明」,会写长文还有感情色彩
一个叫「张小明」的 AI 机器人,最近忙坏了。
里约奥运会开赛一周,AI 机器人「张小明」通过对接奥组委的数据库信息,实时撰写新闻稿件,以跟电视直播几乎同时的速度发布稿件。据了解,张小明主要报道乒乓球、网球、羽毛球和女足的比赛,6 天共生成超 200 篇简讯和资讯。
张小明是今日头条实验室研发的 AI 机器人,可以通过两种文本生成技术产出新闻:一是针对数据库中表格数据和知识库生成自然语言的比赛结果报道,即简讯;二是利用体育比赛文字直播精炼合成比赛过程的总结报道,即资讯。
来看看张小明写的简讯:
「丁宁本轮的对手是现世界排名第 7 的韩英,实力不俗。但经过 4 场大战的激烈较量,最终,丁宁还是以总比分 4:0 战胜对手,笑到了最后,为中国延续了在这个系列赛事中最终夺冠的机会。」
据了解,张小明平均每天产出 30-40 篇稿件,以短讯为主。截至目前,张小明的《奥运会乒乓球女单铜牌赛 金宋依 (朝鲜)4:1 奥运名将福原爱(日本)轻松摘铜》,在头条号获得超过 5.4 万用户的阅读量。
除了短讯,张小明还能撰写长文资讯:
全篇 821 个字,张小明通过数据库对接、信息搜集、文本生成、润色完成报道,最后发布、推送到今日头条手机客户端。
张小明到底是什么来头?
张小明,英文名 Xiaomingbot,是今日头条头条实验室的研发成果,其「写稿」模块是由头条实验室与北京大学计算所(万小军团队)联合研发而成。
这是国内第一款可以报道奥运赛事的人工智能机器人,在结合了最新的自然语言处理、机器学习和视觉图像处理的技术之后,通过语法合成与排序学习生成新闻。
相比国内第一代写稿机器人——腾讯的「Dreamwriter」和第一财经的「DT 稿王」,张小明的写稿技术已经进入是第二代写稿水平。与第一代机器人相比,张小明特征显著:
- 1. 速度快:数据库数据更新的 2 秒之内,即可生成新闻稿并完成发布。
- 2. 样式多:既可以生成长的详细比赛描述总结,也可以生成简明扼要的快讯简报,以前的自动体育新闻只能生成较短的文章。
- 3. 自适应:根据比赛选手的排名,赛前预测与实际赛果的差异,比分悬殊程度,可以自动调整生成新闻的语气,并使用感情色彩的词语,如「实力不俗」、「笑到了最后」等。
- 4. 自动配图:以前的自动新闻都只能生成文本,通过自动选图技术,张小明可以给新闻配图,更加生动形象。
据了解,目前在做奥运报道的机器人只有两家——《华盛顿邮报》的「Heliograf」和今日头条的头条实验室「张小明」。
「张小明并非想取代记者。相反,新闻机器人是记者的助手,可以帮助记者更高效的完成新闻报道工作。」头条实验室负责人李磊博士说,「张小明最大的意义在于,面对奥运会这样同时举行上百场比赛的综合赛事,记者很难关注到每一场比赛,而机器人可以任劳任怨的为每一场比赛报道,无论这场比赛多么冷门和不重要。传统新闻理论并不认为这些冷门比赛或者热门比赛(比如乒乓球)的前几轮小组赛有新闻价值,可是通过我们的平台测试,我们发现对冷门场次的报道任然有可观的阅读量,这个阅读量非常长尾,而新闻机器人可以弥补对这种长尾的新闻需求。」
据了解,截止 8 月 12 日 11 点 30,已经有超过 38 万用户通过张小明的报道获取赛事战报,他还在孜孜不倦地,以 2 秒种的生成时间,发布着每一场赛事的新闻稿。