阿里人工智能首秀“我是歌手”背后的商业野心

阿里云小AI

在4月8日晚间举行的“我是歌手”总决赛现场,阿里云人工智能首席科学家闵 万里 的心全程吊在嗓子眼里。

闵万里主导研发的阿里云人工智能程序小Ai当晚需要对这场比赛结果做出预测——通过大量数据的收集处理推断出冠军是谁。经历了四个小时的比赛,结果显示小Ai成功预测了李玟获得冠军。

“紧张坏了,比歌手还紧张。”比赛结束后,放松下来的闵万里对《财经》记者说。

这让人联想起一个月前AlphaGo与李世石的人机围棋大战,但和下围棋不同,预测谁能成为歌手冠军,小Ai还加入了对人类情感的理解。

与拥有固定规则进而寻求最优解的围棋比赛不同,对现场演唱的理解因人而异,也就是说,“对最终‘歌王’的预测是一个无明确规则的广度搜索。”闵万里说,这对小Ai来说是最难的。

不断修正的4小时

“小Ai”主要基于神经网络、社会计算(social computing)、情绪感知等原理工作。小Ai优于现有大数据机器分析的长处在于:它善于洞察本质和实时预测,并能理解人类情感。它通过强大的计算和机器学习能力,不断自我进化。

在“我是歌手”四个小时候的总决赛全过程中,小Ai做了三个阶段的预测。第一轮,对7名演唱者以获得冠军的概率排顺序,预测第七名淘汰选手;第二轮时候,两两PK阶段,预测PK的对象和出场的次序(即上轮预测的其他排名结果);第三轮,在三强选手预测出冠军,其原理仍是依靠获得冠军概率排列。

从结果来看,第一轮,小Ai的判断依据较少,所以对选手获得冠军的概率预测与结果相差较大,但成功预测出淘汰选手;第二轮,小Ai成功预测了对决名单,不过出场次序略有错误;第三轮,小Ai顺利预测出了冠军李玟,但亚军和季军顺序预测与结果相反。

与前两季《我是歌手》冠军歌手实力十分突出不同,本季虽然有大热门的李玟,但也有从一个粉丝开始累积到上百万粉丝群体的韩国歌手黄致列,后者在社交网络上的攻势更加猛烈。这增加了人工智能对结果判断的不准确性,闵万里告诉《财经》记者,“歌手实力悬殊比较大的时候比较容易猜出结果”。

从过程来看,闵万里最担心的是开场的第一轮预测——因为那个时候小Ai判断结果权重最大的是歌手的演唱顺序——第一轮最后出场的张信哲以24%的胜率排名第一。通过不断对新数据的处理,小Ai随后修正了这个错误。

与现场看到较为稳定的数据不同,在系统中,小Ai会每隔5秒更新一次7位决赛歌手夺冠的概率。在两两PK的第二轮,小Ai的实时判断能力才真正发挥了作用。

其中,第一轮结束后暂列第二位的黄致列和第五位的李克勤的几率一直十分胶着。李克勤因在网络直播关注度上略逊一筹,率先出场。此时,小Ai对结果的预判是李克勤有51%的获胜概率,随着演唱进入高潮,概率升至52%。

然而,黄致列演唱开始后,其获胜概率迅速提升了9%,但当他脱下衣服后,获胜概率曾一度下降至51%。在此后,两者的概率比一直在52:48、53:47、54:46这几个数字中间徘徊。直到最后,小Ai作出判断,以57%的概率预测黄致列获胜。

但在另一场张信哲和老狼的对决中,小Ai的预测一直有较大倾向性,张信哲的概率长时间处于75%以上。与人有情感色彩会影响判断,这样的结果说明了机器不带有情感,它试图理解别人的情感,但它做判断时是冷冰冰的。闵万里告诉《财经》记者。

机器是怎样学习的?

小Ai之所以可以做出上述判断,是一个不断学习的过程。首要的工作是通过搜索海量音乐库,培养小Ai的音乐品味,其来源是阿里音乐的200万首歌曲。小Ai需要积累一首歌曲的下载量、点评量这些可以判断歌曲受欢迎程度的数据,以及歌曲本身音频特征和谱曲音乐的关联因素。

接下来,运行在阿里云大数据平台上的三个系统协同工作,预判最终结果。

第一,爬虫系统。通过一定的规则,自动抓取互联网上的评论变化,其数据来源主要是新浪微博等,并以此形成大量的数据供给第二个系统。

第二,情绪分析系统。该系统会根据抓取回来的评论进行实时文本分析,以便分析出现场500位听众评审对歌手的评价。由于现场听众覆盖多个年龄层,且并非专业乐评人,所以这套分析系统的评价只是扩大了样本的规模。

第三,现场效果采集判断。阿里云还将对现场音频数据和舞台效果进行实时采集,并做出判断,以此调节判断歌手夺冠的几率算法的权重。

与人类认知音乐的方法不同,人工智能的结果是寻找最优的特征集,闵万里团队要做的就是指导小Ai通过多个维度寻求最优解。以现场单一的音频为例,小Ai要将其分解成几百个特征。

闵万里以比赛刚刚结束为由,并未向《财经》记者透露小Ai当晚收集数据的量级。但他告诉财经,其学习了上百个特征,并通过阿里云的计算能力为其提供支持。可以肯定的是,当晚的数据运算量远小于阿里“双十一” 购物 节。

阿里布局AI商用

阿里云从2012年开始进行人工智能模块的研发。也就是说,小Ai人工预测首秀的背后,是阿里云5年的技术积淀。

在这场对决判断的背后,阿里巴巴集团及其相关业务公司(下称阿里系)为其提供了支持。阿里云提供了计算能力和系统平台、阿里音乐提供音乐库作为训练基础、新浪微博提供社交网络评价。

闵万里告诉《财经》记者,当晚,阿里巴巴集团董事长马云在内部的聊天群显得十分兴奋。

如果说预测“我是歌手”是阿里云人工智能利用热点综艺节目的一次“秀”,那么这次秀在马云的棋盘上仅是起步。

《财经》记者获悉,阿里系已经准备将人工智能在多个产业落地。闵万里介绍,在内部,人工智能已可对交通作出预测,这与物流领域的菜鸟网络业务相关;可以帮助 金融 机构自动应答客户呼叫,是在支付宝的应用;与预测唱歌比赛冠军类似,人工智能将帮助阿里影业解决选片选角问题,预估影片商业价值,并指导影片的精准 营销

面对社会老龄化,人工智能有望通过医疗数据帮助人们发现潜在疾病,实施预防性治疗。2014年通过收购中信21世纪,阿里系进入医疗行业,随后推出了多款健康产品。

技术一定会推动商业的变革,闵万里告诉《财经》记者,马云在内部强调,健康和娱乐是未来两个非常重要的领域,“我们要在技术上支持这个战略”。

阿里巴巴拥有淘宝、支付宝、微博等多个自行产生海量数据的平台,这是其开展人工智能研究的天然优势,但其面临的挑战也是巨大的。

“神经网络”这些人工智能领域的专业词汇早在20多年前就已经提出,但因为计算能力不足,直到2006年才出现了图像识别的应用。近几年随着云计算的兴起,深度学习不再成为障碍。

小Ai系统与人脑最大的不同是,后者可以做很多随机应变,也就是更有创造性,但小Ai仍只能对既成事实做出判断,这是目前人工智能最大的局限。

IBM的Watson、谷歌的AlphaGo这些先行者相比,阿里的技术积淀有待加深。

随意打赏

提交建议
微信扫一扫,分享给好友吧。