爱奇艺的人工智能到底有多酷炫?
【编者按】Jack Li: 爱奇艺 首席创新师/计算机视觉科学家,目前在爱奇艺进行视频 AI 核心技术研究,负责包括Video in视频AR广告技术、Figure out视频明星广告技术、视频情景广告技术、视频看点搜索、视频智能标签、视频审核、UGC视频智能截图、视频智能云编辑等多项创新产品的核心技术研发。
本文转自“爱奇艺伯乐”;经亿欧编辑,供业内人士阅读。
爱奇艺的AI到底有多酷?我们看看Jack Li怎么说:
AI的四要素
第一是 场景 。要让AI技术发挥出价值,一定要能够找到适合它使用的场景。在爱奇艺就有非常多的AI应用场景,几乎在爱奇艺技术产品的每一个环节,AI技术都能发挥出其重要的作用。
第二是 数据 。爱奇艺视频的数据是极其丰富的,爱奇艺的视频数量都是以亿为单位去计数的。所以说有海量的数据可以去使用。
第三是 计算能力 ,我们有自己的深度学习平台。公司也投入了很多计算的资源进行深度学习和机器学习的研究和研发。
最后一个就是 人才 。毫无疑问,只有最优秀的AI人才,才能真正把AI技术做到极致,而真正把技术做到了极致,产品的体验才会做得更好。
AI的应用场景
作为一个内容,从创作到最终完成的消费,它一共都经历哪些环节呢?这里就是一个内容的生命周期。简单地总结起来一共有五个环节。 第一个就是创作的环节 ,创作完了,它需要进行一个专业化的生产,生产完为了让内容能够到达到用户,还需要被用户发现,还需要进行分发。同时,内容是需要能够盈利的,于是接下来的环节是 营销 ,要能够成功地售卖出去,要把生产出来的这些内容转化成利润。然后,售卖之后,用户去体验这些内容,去消费这些内容。如果是视频内容它可能是去观看,但是消费并不只是观看,它还有更多的内涵,它可以产生更多互动,它可以产生更多关联性用户的分享操作,这些都是属于消费。
这张PPT的左侧讲的是内容的生命周期,而PPT的右侧罗列了很多最新的AI技术。所有的成果让我们AI研究者非常的兴奋,AI技术日新月异的发展,使得那些我们以前觉得很难解决的问题现在一个一个逐渐被解决。这些技术,可以运用到刚才说的内容生命周期的每一个环节当中。在这张PPT的下方,你们会看到一个字母A,上面还有一横,这个其实是个字母I。我觉得AI就是一个杠杆。这个杠杆让我们能够用技术去撬动产业,能够让技术改变我们的生活。阿基米德说过,给我一个支点,我就能撬动整个地球。AI在这个时代中,就是能撬动地球的这支杠杆,这个支点。
爱奇艺的AI成果
第一个是 商业智能 的一些例子。我们去采购一部片子的时候,比如说电影,我们首先需要去预测,如果我们买了这部电影,去做它的发行,我们到底能够通过票房收入赚多少钱。也就是说,在购买之前,对电影做一个票房预测。对于电影、电视剧这一类完全是在网络上播放的影片来说,我们需要去预测它的vv量,即videoview视频观看次数的缩写。此外,广告的收入、VIP会员收入也都是有预测的。
UAA部门叫做用户属性分析,他们主要是针对爱奇艺的用户去挖掘用户的喜好,分析出每一个用户的地域,这个地域不光是城市,而且是精确到小区。还有用户的年龄段,他们是什么样类型的职业等等。所有这些用户属性的分析结果,都可以用到个性化推荐当中,包括个性化广告推荐、影片推荐以及会员推销等等。
接下来是 NLP自然语言 处理方面所使用到的AI技术 。包括语义搜索,我们建了自己的知识图谱,我们把演员的信息,无论是他们演过什么剧,还是人与人之间的关系,不管是子女的关系、男女朋友的关系、还是说曾经离过婚的关系,这些关系都以知识图谱的方式建立了起来,索引起来。
然后我们语义搜索的引擎能够去理解用户在搜索框里面输入的文字意图,比方说,输入问题:王菲的女儿是谁,那么在我们的搜索引擎上面也是会得到相应的答案,而且能够搜索相应的影片出来。
NLP同时还会使用到情感分析这一类技术,通过用户对影片的评论,上面的留言,我们可以去分析判断用户对这部片子整体的喜好程度到底是什么样子的。一方面,我们可以去判断到底是什么样的人群喜欢这种类型的片子,另一方面,作为一名用户,他的个人兴趣又是怎样的。NLP还会用到很多违规检测上面。因为我们有很多用户上传的视频,其中必然会包括一些违规的文字。
MMA就是多媒体内容分析平台,这部分我会讲得更详细一些。
多媒体内容分析平台主要解决的是两大问题,第一个是内容发现问题,还有一个是内容创作问题。内容的发现涵盖了什么呢? 它要解决三个场景下的功能诉求。
第一是用户场景 ,我们希望能够把好的内容、用户喜欢的内容精准地推送给用户。这是推送角度。另外一个角度就是满足用户个性化搜索的需求,他希望能够看到某一种特定类型的视频,甚至是视频的片段,我们要有能力帮他把这些片段找出来。然后当用户搜索的时候,能够让他看得到。
第二是商业场景 ,内容营销的过程中,我们希望能够把内容的商业价值更加充分地发挥出来。因为现在的广告大家看得特别多的是前贴片广告,就是在视频播放之前出现的广告。其实,视频内容里面有很多精彩的镜头片段,这些精华镜头是不是也能把商业价值发挥出来呢?这也是我们用AI技术去探索的部分。所以我们有剧情广告,随视购广告等新形式的广告类型,去挖掘和发挥这种内容的价值,这就是AI技术在商业场景方面能产生的作用。
第三是运营场景 ,包括内容的编目。内容的编目是什么呢?就是一部片子在进入爱奇艺影视库之后,我们需要对它进行详细地分析和拆解,我们希望知道一个片子的每一个镜头在讲什么场景,讲的是什么话题,这样就有助于编辑同学把视频内容进一步再编辑,再分割,进而进行再传播。这样才能把内容价值发挥到更大的高度、更大的程度上面。运营层面上还有内容的审核,用户上传的很多UGC的内容都是需要进行审核的。审核需要耗费大量的人力,因为我们每天上传的视频是以十万集记,如果全靠人力的话不能支撑。那么我们需要用机器视觉,多媒体分析的方法,自动地去审核这些内容。内容的发现就是要解决这三方面的需求。
在内容创作这一大的范畴里面,我们希望能够帮助人们,无论是个人,还是专业的机构,都能使得他们的创作过程变得更加简单和高效。同时我们还希望能够让AI自己进行创作,完成一定的创作功能。这其中就包括影片的自动剪辑、自动拼接,还有智能生成特效。这就是在创作领域,我们需要服务的三种类型。
在内容发现这一方向上,我们希望能够充分地理解视频的内容。只有充分地理解了视频的内容,才能更好地去做到视频内容的发现。我们需要知道在视频当中,每一镜头中,究竟是什么人,带着什么心情,在什么环境下,做了什么事,谈什么话题。而在内容创作方面,我们希望能够通过技术让每一个人都能去当演员,让每一个人都能去当导演,让每一个人都能去实现自己艺术家的梦想,同时我们也希望我们所研发的AI技术也能成为一名艺术家。
我把多媒体内容分析团队现在已使用到的技术做了一个罗列。包括人脸识别、情感识别、行为识别,包括实体识别(包括猫、狗、花、鸟等)、场景识别(室内、室外、卧室、咖啡厅、沙滩)、字幕识别(文字、台词),还包括人脸建模、人体姿态的估计、五官定位等等。实际上这张表,远远没有覆盖我们用到的所有技术。
过去几年当中我们一直埋头去研究这些技术,有一些技术已经达到非常高的精度了。去年我们想到世界上去PK一下,看看我们的技术水平做得到底怎么样。于是我们参加了去年ACM EmotiW 2016国际视频情感识别大赛,夺得了冠军。
爱奇艺AI的未来
在一开始讲爱奇艺愿景的时候就提到了,第一要让内容能更高效地去创作,第二要精准地连接人与内容,第三能够让用户在消费内容的时候感到更加愉悦。在这个愿景中,就一定需要,从刚才提到的那五个环节,就是从创作、生产,再到分发、营销,再到消费,在每一个环节当中,都用AI技术让它得到一次升级,去构建一个新的平台。这就是爱奇艺AI的未来。
AI技术是溢出效益非常明显的技术,它能够帮助现有这些产业环节中的每一个方面,这是AI现在最主要的用途。因为AI本质上,到目前为止,是一个效率工具,能够极大地提升效率的工具。我们要利用AI将现有的这些环节,把它们的效率提升到极致。一旦提升到极致之后,会产生质变。就像飞船的运动速度达到第一宇宙速度时,飞船就不会掉下来了;达到第二宇宙速度时,就可以飞离地球;如果达到第三宇宙的时候,就可以冲出太阳系。AI技术能让我们不断地在效率上进行提升,在每一个环节上面提升效率,达到极致。