人工智将如何“杀死”传统新闻阅读?
我们每个人都是信息时代的“拾荒者”。
据统计,微信公众号每天发布文章约800万条,一个“王宝强事件”就能在“今日头条”产生10629篇文章。
每一个热点事件,都会产生成百上千的稿件。
然而我们都明白,一个人不可能阅读成百上千的稿件,在信息洪流下,我们搞明白事情的真相的成本却越来越高。
轰动一时的“王宝强离婚”事件,“娱乐圈内人”金星就在自己脱口秀中表示,所有文章中,只有4条信息真实的。但是,在今日头条、微信公众号等阅读平台,却产生了总计2.5万篇相关文章信息,10万+的文章数量超过1千篇。
信息越多,我们反而离真相越远,想快速了解王宝强事件的真相,我们最快的方式是去问问金星这样智慧的“圈内人”王宝强事件是怎么样的?
然而,热点事件太多,我们离她太远。
我们都痛苦
每天面对海量信息,我们都痛苦。
这周,百度新闻组织了一个闭门产品沙龙,邀请我们一同讨论这个痛苦,百度的新闻产品团队,技术团队一起思考各式各样的新型的新闻产品,希望有好的解决方案,而人工智能给了他们最大的启发。这或许是一个不错的解决方向。
在王宝强事件中,做个比喻,金星就像一个强大的人工智能,她有阅历(足够多的样本信息),有判断力(算法),自然能输出最准确的真相。
百度新闻产品团队就设想——何不尝试做个虚拟的“金星”,可通过对话获取信息的人工智能,让大众们通过询问它最快得知事件真相。
在国外,也有类似“对话新闻”的阅读产品Quartz,但Quartz还只能通过选择固定对话内容进行互动——像个带着互动按钮的新闻阅读器,Quartz给我推送了一条麦当劳巨无霸发明者去世的消息,我只能点“看下一条”(NEXT),或者“知道更多”(MORE)选项。
而百度新闻产品技术团队开发的新功能产品,能让用户直接输入各种开放式聊天内容,查找热点事情的真相脉络。
估计也只有百度、Google等拥有强大的“语义识别技术+爬虫技术”的搜索巨头,才能做出实用度如此高的新闻聊天机器人了。
(打开“百度新闻”,下部就有个醒目的“聊新闻”标志)
例如我输入“王宝强”,别的新闻APP可能搜出来的文章是一些《马蓉离开王宝强30万都付不起?》、《王宝强现身机场,潮衣名牌不见“傻根”》等离王宝强近况相去甚远的“垃圾文章”。
要知道王宝强事件的近况,我得花不少精力从这些垃圾信息中寻找有用信息。而百度新闻“聊新闻”,却在1秒钟内准确的告诉我“王宝强马蓉离婚已三月...如今......”
虽然对信息的给予还不够好,但是我看到了人工智能通过聊天最快给于我真相的可能性。从时间、背景等维度,给我展示事件当下的情况。
人工智如何杀掉垃圾信息?
据百度自然语言处理部工程师介绍,百度是通过对新闻信息的分类,之后进行结构分析,通过信息特征学习等方法,实现自动为用户提供最核心的信息。
也就是说,百度新闻的人工智能,是在模仿人的思考,例如把“王宝强事件”相关的所有文章进行样本分析,把内容进行“标签化”区分,分割到最小维度,然后找出事件核心发展脉络,去伪存真,把掌握最真实的事件通过聊天的方式输送给用户。
这就像创造了一个虚拟的“金星”,为你看了上千篇文章,然后经过分析整理,用几百字告诉你真相。
百度的算法团队认为,核心的内容本身有序的,聊新闻呈现的内容,是事件的核心内容,对于每一块核心内容来说都能够抽取一些关健词,关健词还可以为用户进行衍生阅读服务。
例如了解事件的更多背景,例如“王宝强事件”对婚姻法感兴趣的用户,可以被推荐关于这个事件法律分析的深度文章。当对同一个事件有深度个性化需求的用户,通过人工智能推荐,可以对该事件做深度的外延阅读。
对话,或许才是人类获取信息的最初形态
百度聊新闻用聊天获取信息的方式,业内有一些产品经理认为有“逆用户习惯而为”的意味,但当我们拉长人类历史,会发现一直以来,对话式反而都是人类获取信息最简洁方式、有碰撞、直击问题,《论语》、《圣经》许多部分等都是对话式的。
自第一份现代报纸的雏形,1566年威尼斯不定期发行的“威尼斯小报”为公众分享商业信息开始,经过几个世纪的发展,现代人类已经越来越习惯用阅读新闻的方式获取信息。然而,在更早之前,我们更喜欢用对话的方式获取信息。
就像第一代iPhone诞生前,人们之前觉得“键盘”才是最好的人机互动方式,然而自然手势互动才是更早前人类最自然的人机互动方式。
1985年,《科学发现》杂志采访了“人工智能之父”明斯基,他认为人类是一种独特的足智多谋的动物,当人类思考某一事物时,你可能以语言表达的方式去思考,也可能以逻辑术语的方式去思考,或者是图表、图像,甚至是某种结构的方式。
而如今,百度新闻正试图用人工智能,完全颠覆我们几个世纪以来获取信息的方式,但按明斯基的理论,这或许并非激进,而是一种“回归”,我们其实能用各种方式获取信息,何不用更高效那个?我们需要站在未来看未来。