今日头条公开算法推荐系统细节:算法做不好的 需要内容干预
1月11日,今日头条召开了一场旨在推动整个行业来问诊算法、建言算法的分享交流会,会上,资深算法架构师、中国科学技术大学计算机博士曹欢欢,面向行业首次公开算法原理,同时接受意见和建议。
针对推荐算法如何引入无法直接衡量的目标,曹欢欢在会上提出了自己的观点。
“点击率、阅读时间、点赞、评论、转发,这些都是可以量化的。但一个大体量的推荐系统,服务用户众多,不能完全由指标评估,引入数据以外的要素,也很重要。有些算法可以完成,有些算法还做不到、做的不好,这就需要内容干预。”曹欢欢说。
曹欢欢举例称,比如广告和特型内容频控。像问答就是比较特殊的内容形式,题目推荐的目标不完全是直接消费,还要考虑吸引用户回答为社区贡献内容。这些内容和普通内容如何排列,怎样控制频控都需要考虑。
“此外,平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预。”曹欢欢指出。
此外,曹欢欢还分享了包括如何在线训练大规模推荐模型,典型召回策略的设计方法,多目标如何融合等核心问题,同时重点讲解了今日头条的内容安全机制及相关举措,公开了风险内容识别技术以及泛低质内容识别技术。
徐一龙在谈到今日头条对行业公开、透明自己算法原理的初衷时说,算法也是一种“法”,都是通过一定的规则和方法,达成预期的一种效果。算法和法律法规一样,如果施行的好,都很高效,也都要求透明。
多位参加交流的来宾反馈,今日头条公开算法的基本原理,并接受建言,体现出了一家平台对技术发展的责任感与诚意,这将对算法应用乃至整个 互联网 行业,起到巨大的积极推动作用。