Oben:将AI接入VR,让你在家也能和“爱豆”面对面
我们可能没有见过Nikhil Jain本人,但是现在我们可以通过电脑屏幕,看到只有上半身的形象的Jain的动画版本,它说话的语调和口音和现实中的Jain一模一样,只不过这个动画小人没有头发,声音有点像机器人。
在过去的三年中,Jain一直在为自己创办并领导的公司Oben尽心尽力。这家公司想要将单一的影像和声音片段相结合,并自动生成影像所包含的对象的虚拟数字形象——不仅形象和声音能够做到和本尊几乎相同,而且还能够说话或者唱歌。
当然,这并不是真的你——也不是碧昂斯或者迈克尔杰克逊或者任何Oben所创造出来的数字形象,但它的确能够做到和本人十分相似,这会让这个数字形象在很多方面都有用武之地。也许你和Jain一样,希望当你不在孩子们身边时,能有一个虚拟的你,用你的声音给他们讲故事;也许你是一个名人,希望你的粉丝们能够通过手机应用或者VR程序和你的虚拟形象合唱一曲;又或许可以通过这种方法让已经离世的名人能够再次亮相。这项技术带来的机遇是无限多的——甚至可以说多到可怕。
Oben位于加利福尼亚州帕萨迪纳市,截至目前,公司已经筹得了900万美元的资金。Oben计划在今年年底推出一款App,用户可以通过它制作自己的虚拟数字形象,并和朋友分享相应的视频片段。
Oben和还一些亚洲乐队一起合作,希望能推出一个移动端,让粉丝通过虚拟数字形象和喜欢的明星一起合唱。另外,上个月,Oben还宣布将和HTC Vive展开合作,共同将公司的虚拟数字形象技术用于十分受欢迎的社交软件微信。
不过,现在要想制作出和Jain那样的数字形象还需要很多的时间,而且还只能捕捉腰部以上的图像(Jain说公司试图制作出身体的其他部分,但是在动画制作时捕捉总是不够精准)。虽然只需要一张图像和一段2—20分钟(越长越好)含有丰富音素的朗读音频,但Oben要使用深度学习系统运行约8个小时才能生成最终的数字形象。这其中包括对录制音频的处理、根据不同对象的口音或者音色创建声纹以及创建3D版本的人物模型等。Jain表示虚拟人像的面部运动是根据创建对象的自拍照和声纹预测得出的。
Jain表示,公司即将推出的App将把重点放在制作虚拟数字图形象的速度上,质量方面会稍微放松一些。Oben还在研究该如何将讲话内容和面部表情对应起来,这样,虚拟数字形象在讲任何一门语言时都会显得更加自然。现在,这项技术只支持英语和中文两种语言。
不过,只要Oben开发的这种数字形象产生了任何实际的用处,人们就会对它产生各种各样的疑问。比如说,如果你去世了,那么你的虚拟数字形象是否应该继续保留?或者像Oben几年前发布的这个演示视频描绘的那样,其他人利用你的数字形象信息重新创建你的形象,这会让你产生困扰吗?
Jain表示,Oben和其他需要处理用户数据的公司一样也需要处理用户去世而遗留的数据问题,但是他也不知道这些问题的答案究竟是什么。不过,死亡不仅给数据的处理带来了问题,还为这项技术创造了无限的商机。可以说Oben商业模式的一部分正是依赖于此:已经有很多很久前去世的和最近故去的名人的管理机构向Oben抛出了橄榄枝。