算法有三个陷阱,移动资讯客户端如何规避?
今天朋友李俊在朋友圈的一则吐槽引发了我对移动资讯客户端的思考。
前几天有在媒体平台工作的朋友问我:为什么他们怎么努力都达不到今日头条如今的高度?
抛开一切因素,最关键的可能还是精英思维在作祟,对内容的严格审核把关,那些无法满足大众低俗趣味的文章不给流量推荐,这是平台的致命伤。
别人就喜欢吃屎,非要给别人吃山珍海味,你觉得自己对别人好,但别人可真不这么认为!
这则吐槽是老生常谈,然而却说明了眼下做好流量推荐这事儿,将关乎移动资讯平台成败这个道理。
移动资讯平台的内容推荐,要依赖算法还是依赖编辑?眼下业界正在开始向算法倾斜。
依赖编辑的问题很明显,编辑的品味决定大众阅读的品味,然而这势必带来一个问题:阅读面变窄,每个人看到的内容都是相似的。过去门户网站,以及门户时代的新闻客户端,正是这样做的。如果说,我们只是看新闻,看具有时效性的资讯,这个模式没任何问题,纸媒时代不就是这样做的吗?
然而,我们面临的挑战是,过去用户只会订阅一两份报纸,一两份杂志,一两档电视节目,而今天的手机已经将用户与海量的内容生产者连接起来,用户面临信息大爆炸的同时,信息本身在改变:资讯不再等于新闻,而是五花八门的内容。正是因为此,传统的编辑推荐模式,开始失效了,这给了算法可乘之机,今日头条、一点资讯们可以异军突起,UC、百度们现在还在努力杀入古老的资讯市场,正是看中了算法带来的机会。
在信息大爆炸时代,只有通过算法才能帮用户从海量内容中发现适合自己的内容。在碎片化阅读时代,只有通过算法才能不断推荐用户感兴趣的内容满足其“刷资讯”的需求。在泛资讯阅读而不是新闻阅读的今天,只有通过算法才能满足用户五花八门大杂烩式的内容消费需求。来势汹汹的算法推荐技术,引入九大巨头角逐移动资讯客户端市场,很是热闹。
然而,算法并不是万能的。前几天,在贵州省贵阳市举办的第十六届中国网络媒体论坛上,凤凰网CEO、一点资讯董事长刘爽的分享,在我看来十分准确地点名了算法本身的缺陷,用刘爽的话说,基于算法的推荐优势明显,然而,却有三个缺陷。
缺陷1:“千人千面的算法带来我们个体的信息孤岛化”。
就是个性化推荐容易让我们的阅读范围越来越窄。刘爽认为,个性化算法的基础逻辑是,不断地了解用户的兴趣,进而结合其兴趣进行内容推荐,用户用得越久,推荐就会愈发精准。久而久之,算法给用户推荐的内容在越来越精准的同时会越来越狭窄,比如喜欢历史、体育的用户可能全屏幕都是这些内容,而这将阻碍用户关注到理应关注的资讯,或者潜在感兴趣的资讯。
这一点我深有体会,由于我关注科技比较多,因此我在今日头条等个性化产品上几乎全都是科技数码内容,然而我同时也会关注历史、娱乐、财经、电影等话题,有时候还会看一些时政新闻,这时候还我就必须要去别的App比如网易新闻客户端才能看到,这显然不是个性化内容平台愿意看到的。
缺陷2:“基于海量点击的算法推荐带来的阅读和视野的狭窄和偏见”。
个性化算法的基础逻辑是,如果一篇文章被点击的越多就表明它更受欢迎,基于此它更应该被推荐给你。微信公众平台上能形成10万+的阅读就算不错了,而个性化资讯平台上动辄出现100万+阅读的内容,就是因为后者采取了基于阅读效果的个性化推荐技术。就是说,个性化阅读很容易形成阅读量的“马太效应”,强者恒强,弱者越弱,说白了,就是强化顶部阅读,弱化长尾阅读,然而这显然违背了个性化阅读的初衷。
在刘爽看来,这个推荐逻辑导致的后果是,“算法推荐的是大众,甚至是庸众一致叫好的高点击作品,但不一定是用户所在的那一个圈层所高度认可的。”,不同圈层有着不同的偏好,比如中产阶级、90后、互联网圈、妈妈圈,大家都有自己的阅读偏好。大众喜欢的不一定是你我喜欢的,很多人喜欢鸡汤、喜欢咪蒙、喜欢八卦,但也有很多人不喜欢。如果基于此进行推荐,等于让每个人的阅读趣味被迫随大流,这比传统编辑推荐模式更加可怕:主编的阅读品味可是高于大众平均水平的。
缺陷3:“标题抓眼球这一算法点击推荐模式带来的阅读的浅薄化甚至低俗化”。
“标题党”是移动资讯平台被诟病最多的问题,事实上,不论是今日头条,还是微信公众平台抑或新闻客户端,上面的内容生产者都明白一个浅显的道理:一个内容的传播效果,内容、标题与分发各占三分之一,一个好的标题会成就一个平庸的内容,反过来,一个差的标题会毁了一个优秀的内容。然而,何为好的标题?如果从分发效果来看,大众对危言耸听、惊悚离奇、低级趣味的标题反而更加喜闻乐见,哪怕文不对题。因此,“标题党”就成了“标题党”。
正如刘爽所言,“海量读者因为非常耸动的标题被吸引过去,看了以后立刻走人,虽然他个人的体验很不愉快,但他点击这个行为留下来了,被算法捕捉到,所以形成了恶性循环,越多的人被吸引,它也会给这个新闻更多的权重,所以会推荐开去,这严重影响了阅读的体验。”由于标题决定内容分发效果,最终所有标题都想方设法去迎合人性中的阴暗面,去耸人听闻文不对题,好内容不如好标题对内容生态是一个巨大的打击。
在WEB内容时代,如何让人们更好地发现与消费优质内容?搜索引擎PageRank算法的逻辑是,如果一个网页被别的网页引用得越多,这个页面就有更高权重。同时,如果一个网页更加符合HTML规范和语义,也将拥有更高权重,反之则被降低惩罚。如果这个页面所属网站本身一直有很好的信用,它会有更好权重,反之则被降低权重。这套体系非常有效,确保了搜索引擎的体验。移动互联网时代,个性化推荐取代了主动搜索成为用户内容获取的首选方式,WEB内容推荐逻辑也失效了,然而,与之匹配的内容推荐体系还没有成型,这是个性化算法的挑战,也是机遇。
在规避个性化算法三大陷阱上,我看到了这些值得一提的方式:
1、算法为主,编辑为辅,配合作战。
今天人工智能技术方兴未艾,AlphaGo战胜了最聪明的人类,机器已经可以取代记者写稿,许多人都在讨论机器会不会取代人类,在这一点上我十分认同马云前不久在云栖大会上提到的观点:
计算机一定比人更聪明,因为计算机不会累,没有情绪,不会发脾气,对它来讲,它永远只要加了数据以后,它会越来越聪明,但是计算机不可能统治人类。过去机器是人类的工具,未来机器是人类的合作伙伴。机器不可能有智慧,机器不可能有使命,机器也做不到价值观,也不可能有很好的这套文化体系。
在资讯推荐上,算法的优势毋庸置疑,然而,它不可能取代人,编辑有智慧、使命、价值观、文化趣味等等,这些如果能够与算法结合,一方面可帮助算法进化,另一方面可直接影响推荐。一点资讯采取算法为主、编辑为辅的方式,尝试给技术注入人文情怀,把媒体基因以及编辑对用户、对内容消费的深刻洞察融入算法,AlphaGo是深度学习棋局,一点资讯则是人工编辑将上万篇包括普利策新闻奖在内的优质文章输入内容库用以训练机器算法,让机器通过寻找其中共性,学习筛选具备同类特质的文章再应用于内容画像和推荐分发;天天快报则采取编辑为主、算法为辅的方式,他们会有微信群收集优质内容创作者的优质内容并酌情推荐;今日头条强调依赖技术,但有消息称他们也在引入编辑模式。
2、用户参与,数据多元,综合评价。
如果我们只是基于用户阅读数,点击量这样的少数指标对一个内容进行是否受欢迎的判断,并不恰当,但如果能够引入“内容阅读时长”、“内容评论数量”、“内容分享次数”这些数据,并将这些行为相关的数据进行再度收集,形成更加全面的内容反馈数据,基于此进行内容质量评价将更加客观。在这一点上,一点资讯的做法不失为一种比较好的尝试,除了用户点击、阅读时长、是否有收藏点赞分享这些纬度,还会更加依赖用户的主动兴趣表达,一点资讯在成立初期便把搜索引擎在底层技术架构融入到推荐引擎中,目前是唯一一款可以实现搜索任意关键词再订阅成为用户专属个性化频道的产品。
与此同时,通过反作弊技术去剔除掉“脏数据”,并允许用户举报标题党、低至化等方式来降低一个内容的权重,甚至降低一个内容生产者的整体权重,说白了,就是把搜索引擎对网站网页的套路,搬到移动资讯客户端上来,眼下我看到今日头条、一点资讯已经开始有这些动作,比如允许用户举报标题党。
还有就是对用户应该进行更加全面的了解。我们不应该只是了解用户当下的阅读兴趣,订阅过什么频道,消费过什么内容,这些信息完全不足以了解一个用户,更别说一个用户还会随着场景的变化、时间的迁移而改变阅读需求。我们应该去了解这个用户的职业,圈层,口味等等一切可以了解的习惯,并基于此进行更加智能的推荐,避免让用户阅读兴趣越来越窄,在这一点上一点资讯做得比较好,至少在兴趣标签上一点资讯就有多达300万个,你不只是订阅几个频道,而是可以搜索你感兴趣的一切话题,结合搜索引擎+推荐引擎,一点资讯对用户进行了主动与被动的全面了解。
3、人人为我、订阅关注、众包编辑。
微博与微信公众账号是个性化资讯客户端吗?当时是,曾几何时,微博只是基于follow关系给你源源不断的信息流,其逻辑是“我关注一个人,就会关注这个人关注的内容”。现如今微博也十分强调算法,信息流中会出现你没有Follow的信息。微信朋友圈和微信公众账号则依然是基于人与人的关系的内容推荐,朋友圈中人人都是编辑,给你过滤了许多信息,我们订阅微信公众账号同样是因为一个人或者一个组织。
正是因为此,今日头条、一点资讯、天天快报都会强调“订阅”,希望可在内容生产者与内容消费者之前建立更紧密的联系。然而,除此之外,资讯客户端是否可以考虑更多地利用人与人的关系?比如我关注一个内容生产者,就可以看到这个内容生产者阅读或推荐的内容,知乎在这一点上做得就很到位,百度知道之后知乎为何脱颖而出,就是社会化,就是利用好了人与人的关系,美国版贴吧Reddit定位为社会化新闻网站,其理念正是人人皆是编辑。那么,个性化资讯之后,会不会是社会化个性资讯客户端呢?我想,很有可能。
微博@互联网阿超微信罗超(luochaotmt)