一线|知乎李大海:平台管理不仅通过人工手段 AI也参与其中
腾讯《一线》作者 相欣
4 月27 日,知乎合伙人、高级副总裁李大海在第十届全球移动互联网大会上发表主题演讲 “AI 算法与人文价值”。
李大海表示,如果把知乎看成一座拥有一亿四千万居民和游客的超级城市,知乎的社区规范就是让城市正常运转的法律法规。知乎平台的管理不仅可以通过产品和运营手段来人工完成, AI 也有能力参与其中,让社区规范被更加智能高效地执行,让互联网讨论礼仪被更好地普及,这正是AI 所能够带来的人文价值。
李大海介绍,在应用 AI 上,知乎有两大优势。首先,知乎积累了非常好的中文语料库。知乎上不仅有大量优质问题和回答文本,同时,用户在知乎上的行为也是非常重要的数据。用户在生产和消费内容的同时,他们还会一同参与社区建设,比如,用户对回答的赞同和反对,对内容的举报,对问题和话题进行公共编辑等等,通过这些有监督的语料,知乎对于语言的理解可以达到一个更高的层次。
其次,知乎还积累了丰富的社区管理经验。在摸索社区规范的过程中深刻理解了不同用户的不同诉求,让社区规范适配复杂多样的场景。这些经验亦为知乎使用 AI 算法来进行氛围治理打下基础。
李大海介绍,知乎目前通过算法机器人瓦力实时高效处理多个场景:答非所问,歧视、恶意贴标签、辱骂等各种不友善行为等,全力减少低质和无关内容对读者的干扰,降低网络暴力,为用户提供人文关怀。目前,瓦力的准确率在部分场景中最高能达到 99.13%。后续,知乎会在保证准确率的基础上,不断提升瓦力的覆盖范围。
此外,知乎还尝试在语义分析的基础上,进行情感分析的前沿探索。
知乎通过对庞大且高质量用户行为数据的分析、学习,对语义和用户关系这两方面进行更深层次的理解和建模,从而有机会突破“识别反讽”这个一直困扰情感分析领域的前沿话题。这将对中文互联网乃至世界互联网的讨论环境产生促进作用。
演讲最后,李大海还首次对外公布了知乎智能社区概念。
在垃圾泛滥的互联网信息海洋中,真正有价值的信息是绝对的稀缺品。李大海称,技术一直在帮知乎实现更精准高效的连接,现在 AI 已经深度参到社区内容分享和流通的每一个环节,让对更多人有价值的问题被提出,让最适合回答的用户被邀请,让更多分享见解经验的欲望被激励,让更多专业认真的知识被推荐,让更多人的好奇心被满足,让 1 亿 4000 万注册用户甚至数亿网民连接到一起,这是知乎正在努力,并且初步成型的知乎智能社区。
截止 2018 年3月,知乎已经拥有 1.4 亿注册用户、3400 万日活跃用户,平台上累计提问量达 2300 万,回答量则已经突破一亿。