危机中的“今日头条”
文 | L
今年春节可能是 张一鸣 过得最不开心的一年。
当各大互联网公司豪掷千金在各大春晚上怒刷一波存在感时,本来也准备大干一场的今日头条旗下两款产品——“火山小视频”、“抖音”,却遭遇了春晚冠名被多家卫视临时撤下的尴尬窘境,最后不得不用刚刚收购的自拍相机App激萌救场。
至于冠名被撤的原因,据钛媒体报道,大概率上是因为李天佑,这个中国喊麦第一人因歌词含有违法性质而被央视《焦点访谈》点名批评,随后遭到全网封杀。而火山小视频正是李天佑直播的平台。
把时间往前推2个月。
2017年12月29日,因传播色情低俗信息,存在严重导向问题,对网上舆论生态造成恶劣影响。今日头条手机客户端“推荐”、“热点”、“社会”、“图片”、“问答”、“财经”等6个频道被暂停更新24小时。
短短两个月时间内,这家被媒体捧为“TMD”三小巨头之一的明星公司,旗下多款产品遭遇了不同程度的危机,而这很难说不是在为其 信奉的“算法没有价值观”的“价值观”买单 。
众所周知,今日头条以新闻聚合阅读起家,利用个性化推荐技术,打造出一款千人千面的资讯App,正是由于其对用户资讯需求和阅读喜好的准确把握,短短几年时间内横扫国内新闻阅读市场, 甚至开始威胁到百度在内容分发领域的地位 。
然而即使今日头条强大如斯,其头上却始终悬着一把达摩克斯之剑—— 版权与灰色内容 ,这也是算法短时间内难以克服的阿喀琉斯之踵。
算法的瓶颈
人工智能时代,算法确实代表着更为先进的生产力,但算法并不是万能的 。
去年9月,人民网曾连发3篇评论文章,批评以今日头条为代表的,单纯依靠算法推荐的 平台价值观缺失 、 制造信息茧房 以及走向 媚俗化 ,并过度追求“眼球新闻”。
事实上这也是今日头条目前所面临的算法瓶颈 。
作为对外界批评的回应,今日头条在2018年1月对外公布了算法原理。
图片来源于网络
根据其公布的文章来看,今日头条采用的典型推荐算法有协同过滤、逻辑回归、DNN、因子分解机(Factorization Machine, FM)和梯度提升决策树(GBDT)。
虽然目前业界普遍采用的是 混合推荐 来综合各个推荐算法的优点,但算法的弱点仍然没有被真正避免和弥补。
首先,算法严重依赖于数据的优劣。 训练数据的优劣则直接关系到算法模型的优劣 。
算法背后实质上是机器所做的枯燥乏味的,冷冰冰的数学计算,计算结果基本上就是后续内容推荐的依据。
虽然 点击率、阅读时长、点赞、评论、转发 都是推荐模型里可以量化的指标,但各大推荐平台却不得不承认 点击率 在推荐模型里仍然占有很高的权重。
利用人性弱点攫取用户注意力的内容,在点击率这个指标上面的表现天然好于一般内容甚至是优质内容。
而用户的点击阅读行为数据反过来又会成为训练模型的数据,成为给用户推荐内容的依据,如此循环往复, 最终畸形的数据造就畸形的模型 , 畸形的模型组合成畸形的系统,畸形的系统推荐出畸形的内容。
其次是数据有效性问题 。
用户的需求变幻莫测,但系统却难以捕捉需求背后用户的真实意图,再加上阅读场景的不同,用户之间的个体差异,看似需求中暗含着某些规律,实际上可能是“ 技术的幻想 ”。
最后,目前世界上还没有任何算法胆敢保证其推荐内容的质量。
媒体习惯于夸大其词,比如过于强调人工智能的“智能”,而选择性忽略人工智能技术实际的进展和应用情况。
事实上目前的个性化推荐系统还远没智能到读懂文章的内容,更没法从本质上分析内容有没有价值,而只能从外部的数据来衡量文章的质量。
从这个角度看算法确实没有“价值观”。
因为它还不知道价值为何物。如果没有编辑干预,个性化推荐系统会推荐什么样的内容难以想象。
而作为国内最大的个性化推荐平台之一,今日头条显然对这些问题有着深切的感触。
了解人工智能的人都知道,数学里的 极限理论 在人工智能领域有着广泛的应用,虽然完全去捕捉用户的需求和意图不可能,但通过获取 更多维度的数据 , 交叉验证数据的有效性 或许可以去无限逼近用户的真实需求和意图。
与用户行为数据和历史阅读数据相比,更有效的数据莫过于社交数据。
根据GWI2017年的报告显示,平均每个网络用户每天在社交媒体和在线通讯平台上花费2个小时15分钟时间,而这一数字在2016年还是1小时49分钟。该报告还显示98%的网络用户至少使用了一个社交网络。平均每个网络用户拥有7.6个网络账户。
图片来源于网络
无疑社交网络成为了数据挖掘的富矿,也能很好的模拟现实社会。
但作为一款资讯产品,今日头条的社交化之路并非坦途 。
社交化苦旅
国内尝试做社交产品的互联网巨头并不在少数,甚至说个个都有社交梦,大到阿里、百度,小到网易,搜狐均在社交领域有过锲而不舍的尝试, 但鲜有成功的案例 。
在QQ及微信的阴影之下,再加上微博、陌陌环伺,要从强敌面前趟出一条血路,难度着实不小。
但对于国内的顶级流量玩咖来说, 今日头条客户的用户及流量增长已经放缓 ,把海量的流量导出去,发力社交,提高用户粘性,并利用社交数据反哺推荐系统,提高竞争壁垒形成护城河是其不得不做的事。
于是也才有了今日头条不惜和早期投资方新浪微博撕破脸也要做类微博产品的故事。
虽然新浪微博早在今日头条2016年年末的融资中已经出售股份退出,不过随后的几个月里两家公司还是相安无事。
直到去年9月,今日头条为了推广微头条业务,允许用户将微博上的内容同步到头条,这引起了微博的强烈不满, 直接导致微博关闭了微头条产品的数据接口 ,并禁止微博内容自动同步到微头条平台。
此后两家公司你来我往交战数回合,但微博显然已无力阻止今日头条一心要做社交的心。
正如诺贝尔经济学奖获得者詹姆斯·托宾所说:“不要把你所有的鸡蛋都放在一个篮子里,但也不要放在太多的篮子里”。
张一鸣深谙此理,推出微头条只是今日头条布局社交的一环,今日头条还通过孵化,收购和投资等各种手段拥有了抖音、悟空问答、火山小视频、musical.ly、Face U激萌、Live.me等多达6款社交或具有社交属性的产品矩阵。
放眼整个中国互联网,拥有如此之多社交产品的也仅此一家,怕是 腾讯 都自愧不如。
但如此激进的布局也折射出了今日头条在社交化探索方面的焦虑。
能否将这么多产品真正的整合起来形成合力尚且不论,单是每款产品的运营支出就是一笔巨大的开销,至少就目前来看,这些产品都还处于烧钱阶段,并未见有产品已经盈利的公开报道, 此是其一 。
其二,以上产品均属于弱社交产品,用户间的社交行为很难映射到现实社会。
不同于微信这样的强社交产品, 弱社交产品往往需要持续不断的高质量UGC内容才能维持用户的活跃度 , 需要一个活跃的,不断有活水流入的社区才能保持较高的用户留存率, 这不仅需要强大的运营能力,更需要社区有自生产IP的能力,但就目前来看,道阻且长。
火山小视频花重金从其他平台挖来的天佑还被封杀了,甚至还影响到了平台本身的推广节奏。
其三,通过这几年的野蛮扩张,今日头条树敌无数。
除了和新浪微博已经撕破脸,悟空问答挖角 知乎 的行为难免不让 周源 耿耿于怀。而作为国内的社交巨头腾讯是否会采取防御措施也未可知。
最值得一提的是,今日头条之所以能够如此激进的布局社交,是在于今日头条App强悍的吸金能力。
数据显示,2016年,今日头条靠信息流广告收入达60亿元;2017年,增长至150亿元;2018年的目标则是300亿~500亿元。
这也是为什么今年1月底,百度和今日头条有了一轮正面交锋,百度显然不愿意看到自己的广告市场被活生生的蚕食,“百头大战”恐怕在所难免。
当一艘航母孤零零的在海上航行,护航舰艇却还在造船厂没下水,一旦遇到强敌的猛攻,场面可以想象。
然而不幸的是,张一鸣的社交梦却依托于今日头条这艘“资讯航母”的平稳航行。
定时炸弹
六大频道被暂停更新“24”小时,和百度爆发口水战,两款产品冠名被撤……这一连串的事件正将今日头条一步步推向舆论风口。
如果说此前六年都是媒体在褒奖一个小巨头的诞生,那么2018年,或许今日头条将面临更多理性的审视。
当一家企业开始被推向舆论的暴风眼时,总有一些事不可控,比如现在的乐视。
除了前文已经详述的算法问题,四面树敌以及社交化的激进布局,埋在今日头条成长路上的另一个定时炸弹则是版权问题。
可以说版权问题自今日头条诞生起就如影随形 。
只要在搜索引擎中键入“今日头条侵权”关键词,就能轻松找到多家媒体的最新报道。
几个有代表性例子,2017年5月,南方日报社发布反侵权公告,称2016年至今,“今日头条”客户端未经许可擅自转载其版权作品近2000条。
在此之前的4月26日,腾讯和搜狐以涉嫌侵犯其所属作品的信息网络传播权为由,将今日头条诉至海淀法院。
更早之前,包括新京报网、《广州日报》、《长沙晚报》、《楚天都市报》等各类媒体都曾因版权侵权和今日头条发生过版权纠纷。
而在短视频领域,优米网创始人王利芬的一条怒批头条侵权的微博则最具代表性,王利芬在微博指出,今日头条旗下西瓜视频毫无版权概念,取材只依据用户喜欢,找到内容第一时间推送并打上台标。
图片来源于网络
此外,在今日头条旗下的短视频平台西瓜视频上,存在着以影视剧片断的形式批量传播的大量短视频,不过此类视频因系用户上传, 平台能借“避风港”规则作“挡箭牌”, 然而侵权风险却始终存在。
一旦今日头条未来计划登录资本市场,迟早要扫清版权障碍,规范化运营 。
只不过正如人民网在三评“算法推荐”的评论文章中所说的那样:智能平台的身上也应流淌“道德的血液”,不能为只为眼前的流量而放弃了长远。
同样借名为知乎作者王科的话:“推荐系统有其边界,一切技术均有其边界,局限于当前技术成熟度,局限于数据,局限于现实世界与技术世界的距离。”
最后,祝愿今日头条,走好。
作者:L,关注前沿科技领域,报道有趣的、有商业价值的公司、产品以及相关的人和事。邮箱:lili.li@cyzone.cn