智能+泛娱乐产业的结合,将为娱乐场景提供更好的交互与体验
4月28日,GMIC(全球移动互联网大会)2017北京站第二天,科大讯飞消费者BG执行总裁于继栋在全球未来娱乐峰会专场带来本次分享的演讲主题《语义识别和 人工智能 挖掘泛娱乐产业金矿》。演讲中, 他认为人工 人工智能不仅仅是个现象或未来场景呈现,而是已经实实在在落地到不同应用场景的存在。 智能+泛娱乐产业这样的结合,将会为娱乐场景提供更好的交互与体验。
以下,是由所长带来的现场实录部分。
科大讯飞人工智能的三个层面
今天的主题是人工智能+共创新娱乐。人工智能这两年非常热。到现在为止,行业对于人工智能的定义已经基本比较明确,我们认为人工智能就是机器一个像人一样能够进行感知、认知、决策、执行的人工系统。人工智能经历了61年的发展,到目前再次站在了第三次浪潮爆发的前夜。
目前科大讯飞的人工智能分三个层面:
第一个层面是运算智能; 即能存会算,就是让计算能够存和算。典型代表就是去年AlphaGo战胜围棋大师的新闻。因为这样的事件大家对人工智能产生了新的关注。运算智能方面,人类已经完全不是计算机的对手了。
第二个层面是感知智能和运动智能; 这几年非常火的语音合成和 自动驾驶 技术,这些都属于感知智能的一个层面。另外一层是运动智能,比如波士顿动力他们做的运动机器。我们今天讲的就是感知智能在很多领域得到应用,并且和人类的水平越来越接近,甚至在一些固定的领域比人类还厉害。但是运动智能是低于人类水平很多,所以我们更多是在感知智能方面获得突破。
第三层面是认知智能; 即认知计算和认知学习,包括逻辑知识学习、语言理解这些方面的进步。在通用领域中,计算机处于6岁小孩的水平。但是在受限的领域,比如法律或者医疗行业的计算机已经达到甚至超过专家的水平。
为什么有这样的进步?背后原因就是深度神经网络和 大数据 以及 云计算 的结合,这样一个迭代能力让技术能够快速的进步。今天主要介绍的是最近科大讯飞在感知智能和认知智能取得的进步和成果,包括在娱乐领域的应用案例。
游戏手办也能和你对话?完全可以!
目前讯飞超脑提供语音交互的交互框架,利用人工智能实现虚拟大脑的作用。也就是我们常说的软件和硬件的交互框架。 语音和娱乐方式的结合目前已经有很多实际案例了,比如在阅读领域、导航领域等。 2014年科大讯飞跟高德导航已经率先上线明星音色的导航技术,在当时达到了比较好的效果。但是现在随着人工智能的进步,我们已经可以达到真人效果甚至超过真人的效果。
这个视频是通过语音合成学习了明星的声音之后制作而成的。现在这个技术通过自动学习实现自动化的语音构建,而且可以达到非常自然的表现效果。
除此之外,也可以通过AI与更多娱乐休闲场景结合:
1、AI与玩具;孩子可以与玩具之间互动,得到更多信息反馈,比如阿尔法蛋;
2、AI与音乐;类似叮咚音箱,可以实现交流并操控智能家居;
3、AI与影视;通过遥控器对网络上海量视频进行准确检索,实现自动化;
4、AI与游戏人物;比如狗尾草的虚拟偶像“琥珀”,她的呈现是通过3D全息影像实现的,主要是IP和用户之间语音交流,实现虚拟养成;
5、AI与游戏手办;喜欢游戏的玩家很多都会有收集手办的习惯,现在我们与金山打造智能游戏手办,通过AI实现交互功能;
6、AI与 机器人 ;不仅可以实现人机交互,也可以分享音频和视频。
这些场景实现的背后是讯飞开放平台不断提供新组合和新技术的结果。目前已有很多应用安装在近11亿的终端之上。用户对语音的接受度非常好,每天活跃用户已超过5千万这样一个可观的数量。
AI+游戏解决方案,完善游戏体验
以上所讲都是开放平台提供的单点技术,这些技术已经落地到很多娱乐领域。我们目前是在更多垂直领域提供整体解决方案,服务更多娱乐化场景。比如现在很火的手游领域,其实有很多痛点存在:
1、全屏弹出键盘——体验差;
2、双手横屏打字——效率低;
3、游戏名词难输——重复改。
虽然目前有手游可以通过文字、语音来沟通,但依然不方便。比如文字沟通,难以准确表达玩家感情,无法即时传达交流指令;语音沟通在公开场合缺乏私密性,而且很难知晓历史消息。
综合这些情况,我们推出了游戏语音解决方案, 在游戏里说话一秒变文字、像微信一样可以发送即时消息、或是用语音指令控制游戏对象代替手动操作、和游戏玩家语音畅聊,这些情况游戏语音解决方案都能满足。
我们针对游戏场景优化之后,可以让语音识别率达到98%,文字显示达到200毫秒以内的速度。很多游戏中使用了讯飞开放平台的游戏解决方案,使玩家的交互得到非常明显的改善。比如西山居的《剑侠情缘手游》,在使用了语音转文字功能之后,社交属性得到进一步优化。现在使用语音交互的游戏玩家,有将近1千万的数量。
会后,西山居CTO成斌在接受AI研究所采访时也谈到,自己对手游行业和人工智能技术结合之后的感受:
“游戏领域AI应用,重点在于提升游戏体验,以及革新游戏制作工艺这2个环节。
核心是体验的提升,以强化学习代替传统的行为树,来打造行为更为丰富的NPC,玩家即便多次重复同一任务,也会有不一样的新鲜感。而MMORPG还可以提供与人类玩家协同作战的NPC,同时NLP也构成NPC的一个重要能力,有时直接在游戏内放置类似siri的游戏助手,智能客服或消遣对象将催生更多的有趣元素。制作工艺的革新,主要聚焦在如何减少艺术家做简单重复事情上,比如图形自动生成等,现在也可以通过GAN来实现超分辨率。”
其实有更多的畅想,比如智能的东西用在游戏模型的演进,甚至在NPC上制作更好的NPC,甚至做虚拟偶像,很多可想象的空间都是人工智能的施展空间。我们把这些游戏放在AR游戏、 VR 游戏、电视游戏等更多类型的游戏里面去。
最后,希望人工智能在未来的几年能够通过落地化的方案,为游戏、娱乐场景提供更好的交互和更好的体验,能够推动新的娱乐发展,我们也会持续为广大合作伙伴去提供更好的服务。
谢谢大家!