美联社又出招!看“机器学习”如何拯救传统新闻业

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

美联社一直致力于将自动化引入到新闻业发展中,这次尝试也是其努力的一部分。

美联社又出招!看“机器学习”如何拯救传统新闻业

一般来说,当一位美联社的体育记者报道一场比赛时,她需要写出8个不同的版本。除了写主要的纸质新闻报道外,还得写新闻概要、有关比赛双方各自的新闻,同时还要将这些纸质新闻转化为广播报道形式。

“一次性要完成这么多工作,这简直是个噩梦。”美联社战略及企业发展部高级副总裁Jim Kennedy表示。总的来说,美联社的记者们大概每周总共要花800个小时来将纸质新闻转为广播报道形式。

因此,美联社正在尝试使用机器学习来将这一转化过程自动化,希望能够通过自动化来缓解记者的压力,与此同时能提高新闻报道量,扩大报道范围,拓展新业务。Kennedy表示美联社希望到2020年,80%的新闻内容生产都能实现自动化,尽管这一具体目标有些不切实际。(后来,一位美联社发言人邮件表明80%并不是一个目标,而是表明美联社要对不断增加的报道内容进行管理的决心。)

美联社又出招!看“机器学习”如何拯救传统新闻业

“我们可以解决这个问题,节省时间让记者去做更多的事吗?像前面提到的体育记者,如果不需要生产8个版本的新闻文本的话,她有时间可以拿着iPad去球员更衣室去拍摄一些视频,”Kennedy表示,“显而易见,自动化会带来好处。”

过去的几个月,在与Matter Ventures(注:风险投资基金Matter Ventur,旨在向媒体界的新生创业团队提供四个月的资金和后勤支持)的合作过程中,一个由5名美联社员工组成的团队一直致力于开发这一自动化框架。

该团队建立了一个模型,该模型可以识别出纸质新闻中那些需要调整为广播格式的成分(例如故事变得更短,句子更简洁,数字四舍五入取整等等)。该项目的成员、美联社战略及企业发展部经理Francesco Marconi表示,尽管它可以识别出那些内容,但美联社尚未对该工具进行实际的测试。

美联社又出招!看“机器学习”如何拯救传统新闻业

为了推进项目,美联社将和其他专门从事机器学习的公司进行合作。首先聚焦于一项具体的体育运动,然后使用其已有的纸质报道和广播报道作为样本来开发出一套可以自动进行版本转换的算法。

Francesco Marconi表示,记者深谙将纸质新闻转化为广播新闻所要遵守的一套规则,然而通过机器学习完成的转换并不彻底。机器学习可以起到作用——本质上这里有一个可以将纸质新闻与该新闻其他不同格式进行比较的算法。例如拿广播来说,机器学习可以识别出人是如何对报道内容进行调整的。当然,首先要在机器中设定好这些规则。但是要想得到让编辑部满意的报道,机器学习和人工操作还是存在差距。

美联社又出招!看“机器学习”如何拯救传统新闻业

去年,美联社制定了一个5年(2015-2020)战略规划。上周,领导层开会决定了优先在明年实现哪些目标。Kennedy表示明年有7个项目正在考虑中,包括有关自动化的工作。美联社一直很关注客户参与和用户生成内容(UGC),但是他希望美联社能够一直资助有关自动化的工作(这个项目开始于2014年)。

和Automated Insights公司合作的那一年,美联社开始自动化生产一些企业收益报道。现在美联社每季度大约生产4000个企业收益报道,这比之前记者撰写多了十余倍。今年,美联社也开始跟这家公司合作,通过将比分数据自动转化为文本来报道乙级棒球联赛。

美联社又出招!看“机器学习”如何拯救传统新闻业

Kennedy说:“我们之前从来没有涉足过乙级棒球联赛,但是现在我们做了,这是一个真正的突破。基于这次成功的尝试,我们很期待还可以在自动化报道方面做些什么。”

Kennedy表示他希望自动化项目的开发时间控制在6个月左右,但目前开发出的模型很简单。保证生产出的广播新闻足够好,不需要在播送前再对其进行人工编辑,只有做到这一点才能该证明项目的成功。“我们可能认为将纸质新闻转为广播新闻很容易,不需要很长的时间。但是仍然有必要根据不同的体育项目设置不同的内容输出模式。” 

为了实现80%新闻报道自动化的目标,美联社正在寻找除了从纸质到广播版本转换外的其他类型的自动化。例如,他们认为可以通过机器学习最终使新闻能够适应不同的设备,从可穿戴的设备到车载声控音响等等。

自动化的另一项用途是根据不同客户或受众的需求来定制报道内容。美联社的体育记者可以为比赛双方的球迷提供关于各自球队的报道。记者也可以针对国内受众和国际受众来使用不同的语言风格等等。这些都可以通过自动化实现。

Kennedy表示美联社认为这种版本转换是其未来发展的关键因素。通讯社习惯于生产不同版本的报道,例如,上午和下午的报纸报道会有差异。但是随着互联网的发展,新闻圈的瞬息万变,美联社为了实现“实时控制”、定期更新放弃了许多这样的做法。

随着报纸仍然面临经济压力,Kennedy承认“新的收益将缓慢实现增长”。多年来,报纸上出现了许多关于关闭美联社的报道。但美联社一直希望能够提供新的产品,包括自动化工作,来吸引报纸和其他客户来使用其服务。

例如,当涉及用户生成内容时,美联社和SAMDesk(美联社投资的一个社交媒体内容管理系统)合作创建了一个工具,这个工具将美联社的渠道策略和SAMDesk的用户生成内容源进行结合,这些内容已经通过认证或即将认证。这个工具起初是供内部使用的,后来决定可以授权给客户使用。

“我们正面临着困境——报纸持续下滑,广播公司合并,并且会一直持续。与此同时,一些其他跟我们类似的机构也在做着相同的尝试。如何取得实质性突破,如何创造价值让传统客户转而购买我们的服务是我们不得不面对的问题。” Kennedy说。

本文由百度新闻实验室(id:baidunewslab)独家编译,原文载于www.niemanlab.org,版权归原作者所有,转载请注明来源。

编译:杨熙伟

编辑:周碧莹

随意打赏

大数据 机器学习机器深度学习统计机器学习机器学习
提交建议
微信扫一扫,分享给好友吧。