VR变默片还有劲吗?时代拓灵CEO认为VR音频应当与视频同等重要

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

VR变默片还有劲吗?时代拓灵CEO认为VR音频应当与视频同等重要

VR次元 孙实 管慕飞 7月6日报道

当我们描述一部优秀的VR作品时,常常会说“我好像真能看到飞机从我头顶飞过”,或是“我好像真的在森林里漫步”,却很少会说“我能亲耳听到飞机的轰鸣”、“我能听到忽远忽近的鸟叫”。

比起影像,VR音频带来的沉浸感可能更为“隐性”。在时代拓灵的CEO孙学京看来,VR市场尚需教育,用户没有刻意去注意声音,但并不代表声音对内容的帮助不存在。

时代拓灵的创始团队是一群资深的老摇滚乐迷。或许正是出于对音乐的执着,在VR音频还没有像视频技术那样引起重视时,他们就先人一步进入市场。目前,公司已经完成天使轮和千万级Pre-A轮融资,目前正在进行A轮融资。

“从展现形式来讲,传统的视频确实很关键,而且都是先想到视频再想到音频。当时确实意识到音频的重要性会提升一些,所以我觉得这是一个契机。”孙学京对VR次元表示。

VR音频应当与视频同等重要

什么样的音频称得上是VR音频?孙学京认为,通俗来说,就是用户在现场实际能听到的声音,即能带来临场感的声音。“比如说在酒馆里的一个场景,大家在讨论,喝酒,各种聊天的声音,你在那儿你听的声音就应该是你觉得在现场的声音,而且要和视频无缝对接。”

从技术上来说,就是用算法来模拟声音的反射。例如模拟房间里声音的反射,那么用户相对于声源的距离、角度,都会成为影响最终输出结果的参数。

然而,相比视觉上的模糊、失真等问题,用户对声音的远近高低似乎没有那么敏感。对此,孙学京也承认这是客观存在的,但他同时认为,好的音频确实可以大大提升用户体验。

“如果你是特别好的内容,一个做个非常好的声音会让你觉得整个画面刻画得都很自然。如果声音没有,那其实你会觉得某些方面有些缺失,但是可能普通人就没有意识到,或者他也说不出来具体是哪不够完美。”

他甚至认为,在VR内容当中,音频是视频应当处于同等重要的地位。

完善的VR音频是和细节在较劲

或许在外行眼中,VR音频就是普通音频加上一套用以处理信号的算法,但在孙学京看来,前后声音是否能很好地区分、混响大小模拟是不是足够好、戴耳机和没戴耳机的效果是否相似等等细节问题,都是决定一段音频是否完善的要素。

VR与传统视频或全景视频所采取的音频技术的不同之处就在于,VR音频必须支持互动,而引入的互动环节越多,技术的复杂程度也就越高。“如果你只是180度前面加3D的话,那你就用普通的就可以,5.1、立体声就可以,因为如果你只是在前面那个视角,你就限定了大家的视角就是前边,你旋转头部所有的交互其实没有了。”

孙学京解释道,现在最基础的互动就是用户的头部围绕原点旋转,这就像视频角度会随着陀螺仪角度的调整而调整一样,音频也必须做出相应的配合。

孙学京说,其实这些算法都是可以支持的,在人不动的情况下把视觉上的物体拉远拉近,这样的算法早已有之,而声音的处理其实是一样的,“只是我们现在拿不到Sensor的数据……但是确实你要做得特别好也挺难,尤其越是细节,很多人不注意的地方,比如那些反射,你在墙角那个点反射,然后我要放在这个地方反射都不一样,这个运算量还是挺大的。”

此外,由于时代拓灵主打的是移动端,因此不能像杜比这些公司一样在音质上追求极致,还要兼顾音频在移动端播放的效果,孙学京表示他们也设置了许多平衡点。

巨头早已开始行动,孙学京:并不担

去年, 谷歌 ( 微博 )收购了专门为VR打造现实音效的初创公司Thrive Audio;今年5月, Facebook 宣布收购VR音频公司Two Big Ears;另据孙学京透露,他的老东家杜比也在做相关的研究。

但孙学京表示并不担心,他认为这些巨头有自己传统的行业方向,“动作相对来说会慢一些,而且固有的技术不能颠覆,然后要维持基于已有的技术去做这件事,其实有时候可能不是最理想的选择。”

目前,时代拓灵已经在软硬件两方面同时与一些企业展开了合作。软件方面,主要是以提供SDK的形式,甚至是直接提供内容。

孙学京认为VR音频市场的竞争相比其他行业要小,但也不能掉以轻心。时代拓灵一定程度上走在了前面,但巨头的前进速度也不容小视。

附采访实录:

问:咱们是哪年成立的?

答:2015年5月份。但是我们认识很早了,总公司注册的话就是5月22号。

问:当时是基于什么样的背景决定从这个领域来切入到VR呢?

答:因为我们在杜比工作,所以一直做的就是音频视频,所以这个跟专业视频相关的就是跟我们做的是很相关的,VR其实核心就是一个娱乐升级体验,当然还有一些其他的行业业务,当然VR里面比较核心的展现形式就是视频,还有其他游戏,这个其实杜比主营业务跟我们一直从事的行业是非常相关的。

然后本来我们又是喜欢做跟娱乐、跟视频相关的事,所以就找到一家公司,给他展示这个,我记得第一次看的是Jaunt VR那个Paul McCartney的演唱会,就是一个全景视频给他看,他看了还是觉得非常不错。因为我们之前在讨论别的创业项目,跟这个相关的,这个其实是生化结合还是非常不错的。做一些Demo,都觉得这个展现形式挺好的。又是演唱会,又是我们喜欢的事,想去做,所以就一结合,是顺理成章的。

问:您大学专业学音乐还是音频制作出身的吗?

答:不是,我大学本科其实学的是心理学。只是那会儿大家都喜好音乐,而且本科做了一个项目其实是跟语音识别、说话人识别、声音处理相关的,所以后来出国也是做声音的。

问:就是个人爱好就是影音、视频这种,后来研究生出去进修。

答:对,博士出去学习也是跟声音处理相关。

问:当时做这个项目是觉得视频要发展起来,但是音频大家都不太重视吧,我觉得包括到现在好像很多人都对这种VR音频不是特别重视是吧?

答:对,这个毕竟从展现形式来讲,传统的视频确实很关键,而且都是先想到视频再想到音频。当时确实意识到音频的重要性会提升一些,所以我觉得这是一个契机。而且本身确实也是很关键的一环。这个确实,我们成立公司的时候肯定很多人还没有意识到这一点,今年其实情况已经改观很多了,也陆陆续续有其他的音频的公司,大家在讨论这个事。但是相对肯定会比视频讨论的会少。

问:在您眼中觉得一个完美,或者比较完善的一个VR音频应该具备哪些要素,就是我在看一个VR视频或者全景视频的时候,这个音频能给人们带来哪些比较好的体验?

答:其实从音频上和视频是一样,我们就想给你带来一个身临其境的感觉,然后你听到这个声音,你就是在现场听到的声音,这是一个比较通俗的说法,比如说在酒馆里的一个场景,大家在讨论,喝酒,各种聊天的声音,你在那儿你听的声音就应该是你觉得在现场的声音,而且要和视频无缝对接。

所以具体从技术层面讲,我们就会考虑一个声源范围是不是定位比较精准,你的音质是不是和原来的音质是保持一致的,因为经过一些信号处理,算法肯定会对音质有些损害,如果是好的算法应该是保持它的音质。然后你的这种效果其实不是表面性的,展现性的,而是如果像素高,跑起来就会卡,这个其实不能接受。

所以在人听的话,这个其实对空间上的听的感觉也是很复杂的。基本上用比较口语化的那就是是不是方位、远近这种音质都是符合的。然后再具体一点,再复杂一点,我们会用专业的词说叫出头感,externalization,就是你戴耳机听的时候是不是好比你没戴耳机。其他细节,前后,比如我们在做三维声音的时候,有遇到前后的confusion,就是前面的声音和后面的声音区分不是特别开,这都是很多细节的东西。包括混响大小模拟是不是足够好,噪音需要去掉。

问:因为技术上我不太懂,比如视频肯定是视觉的,相对于视觉,人类的听觉的灵敏度比视觉还要敏感吗?

答:你是指哪些方面?

问:比如视觉有没有身临其境的感觉,就是我一眼就能感觉出来。但是听觉方面,是不是身临其境,他耳朵能有那么敏感,灵敏度能分辨到底是不是身临其境,就是对本身的用户体验来说影响很大吗?

答:我觉得可能会不像视觉那么直观,这个确实是客观存在的。但是如果你特别好的沉浸感,就好比你去影院,如果这个音响特别好,包围感特别好的话,那其实会大大提升你的体验。因为我们做音频,我们认为声音是非常重要的。经常包括电影大师卢卡斯,包括国外的一些大师都会说,传统VR里面声音都是非常重要的,50%,我觉得在VR音频里,VR内容里更是50%以上。

所以如果你是特别好的内容,一个做得非常好的声音会让你觉得整个画面刻画得都很自然。如果声音没有,那其实你会觉得某些方面有些缺失,但是可能普通人就没有意识到,或者他也说不出来具体是哪不够完美,可能是这一种,不是像视频上,这有个黑点,画面不清晰,大家很容易联想到一些词,或者有经验怎么来形容。

但是如果声音缺失,就有可能说不是特别过瘾,就好像沉浸感不是最理想的情况,但是他又具体说不出来,但是实际你如果点他一下,这可能是声音处理的不是特别好,跟现场的声音不是特别一样,这可能其实他也能够反应上。所以我觉得更多的是属于传统的这种对大家的教育上,当然大家没有过分的去注意声音,但并不代表他对内容的帮助不存在,我是这么理解的。

问:那咱们时代拓灵在这个音频上做了哪些改进,或者技术上有哪些优势?

答:我们主打是这种移动端,然后我们无论从音质、复杂度、跨平台,就是说是做一个工业级的商用的解决方案的话,我们其实考虑还是比较全的,不光是考虑音质,比如说我们以前在杜比可能特别追求极致,但是到了出来做公司,我们做移动端,尤其移动端我们要兼顾它的效果,所以我们做了很多最好的平衡点,就是应该达到什么样音质,达到什么效果。我们在这上做了很多工作。

问:PC VR、移动VR跟一体机参数细微的差别有什么?

答:PC这块肯定用户量要大,人群覆盖率比较大,这其实跟图像都是一样的,为什么很多游戏可以在PC VR上跑,在手机VR上就跑不动,就是这个道理。音频也是一样,我们有很复杂的算法可以把场景模拟得特别逼真,但是到移动端就要做一些,通过把这个复杂度降下来,把一些高复杂度的运算做一些牺牲。但是这些希望对音质不会造成太大的影响。

问:咱们主打移动端VR,跟现在很多手机上都有移动VR了,像华为、乐视,包括之前的暴风魔镜,这个跟他们都有一些合作吗?

答:我们正在开展,签了很多协议。

问:那像咱们这个VR音频对什么硬件有什么要求吗?或者换句话说,现在有很多音质很好,但是由于耳机的问题导致本身的音频,别再由于他们硬件上的一些问题。

答:耳机是一个因素,但是现在只要不是特别山寨的耳机都应该还可以,比如Iphone的耳机其实做的质量都不错。

问:但我是指,能不能因为他们的VR硬件不成功,导致你们的VR音频展现不出应有的效果,这点有没有担心?

答:这个一般我觉得还好,因为我们都是软件渲染,所以如果是软件渲染通过耳机的播放,它的整个里面处理,除非它做得特别差,否则的话我觉得应该还好。

问:对硬件的要求不高是吧?

答:硬件要求不高,我不要求它有什么特殊的芯片,其实就是软件算法。当然得比较高效,还是高端机。还是有一定要求,比如我们用三星S6和小米4,其实是有差别的,因为它们对声音的处理,它们对Sensor的处理是不一样的,比如华为终端机华为和小米,华为它的这个陀螺仪就比三星S6的陀螺仪质量要差,所以你会发现经常你做跟踪的时候,它这个结果就不是特别精准。反正像三星S6质量做得不错,还是有一定的影响。

问:您指的就是说整个移动式VR,包括手机,手机对你的声音影响大还是本身这个VR产品对声音的影响大?

答:我觉得应该是手机的影响。

问:手机影响更大。

答:对,我们比较关注的有几点是,比如一些Sensor数据我们拿得特别好,Audio处理平台是不是足够高效,因为我们特别怕延迟特别高,处理声音我们叫缓冲,声音处理这个小的Subsystem如果做得不是特别好,优化得不是特别好,可能会导致延迟比较高。这个我们发现不同的形式不一样。所以如果真是做得特别好,确实需要深度的订制。这也是为什么三星VR做得好,就是它对三星S6做了深度的订制,他的头盔也做了比较好的外设,交互。

问:在录一些现场演唱会的时候,您这个VR音频怎么用,因为现场可能收声就是那样,声音本来就那样。

答:这是特别好的问题,我们做VR音频我们也做收音端,我们希望从收声一直到播放,其实我们都想参与,如果说现场录的音质比较差,那我们只能从后期做一些加工,做调整,也有一些软件补救的办法,但是确实你要从收音源头端把握好,这个跟相机、视频处理都是一样的。

问:我看消费者,VR展现的主要就是影视,游戏什么的。咱们现在主要是给的是侧重于影视还是游戏这方面?

答:目前两个都有客户感兴趣,我们在推,尤其从SDK角度。但是影视可能会稍多一些。

问:是因为觉得游戏的VR这个音频处理难度更大还是觉得这个市场比较小?

答:这个跟我们推广的,就是说我们侧重点可能有点关系,并不觉得它需求比较低。做游戏的人可能他们都是在PC端,PC端可能用已有的传统SDK满足它的需求。但是确实现在也有游戏,包括一些教育,一些课件在询问跟我们合作。其他的这种影视方其实也是因为我们自己在做一些影视内容,所以从头到尾,导致我们目前看起来似乎推声音的合作方也是较多。但我觉得其实都是一样的,甚至我们还有做社交的,就是在最近开始做。

问:像咱们做VR音频主要还是2B端,跟供应商合作。

答:对,设备厂商,平台播放器这种。

问:跟咱们这个跟消费者直接对接还是目前有点遥远是吧?

答:对,我们通过消费者对接都是通过中间的一些应用,比如APP或者硬件,通过他们跟终端对接,先2B,然后通过他们2C。

问:我第一次接触VR音频是看到,当时业内有特别轰动性的, 英伟达 出一个很牛逼的。

答:Works。

问:对,他到底牛逼在哪儿?

答:我(具体)没有听过,也没有用过,他只是宣传过。我们目前都有尝试过,就是说把很多音频处理用GPU处理,他其实做了很多工作,还是为了卖他的GPU,他把很多很复杂的声音处理通过GPU来实现,比如说房间的反射,发声的声源,我在房间里走来走去,我通过我和声音的远近,位置不一样,我听到的声音因为是不一样了的,所以这个运算复杂度非常大。

问:我站在这儿听到的声音和在那边听到的声音不一样。

答:没错,所以这个算法模拟这个房间,所以就要先构建一个房间模型,然后这个声音要用数学模型在房间里反射,其实理论上有无数个点,但是数学上一定要精简。所以算这个东西就需要非常高效的处理器,你采的点越密,越精细,理论上效果越好。所以你如果是能够高效的算,通过GPU这肯定是非常好的事情。

问:他那个技术可能更适用于PC VR或者立体VR。

答:我个人是目前这么认为。

问:回到团队这方面。咱们现在团队大概多少人?

答:二十几个人。

问:都是主要以技术为主?

答:对。

问:像跑市场,品牌这块部分,就几个人是吧?

答:对,我们有两个员工,一个终端,一个市场,人很少。

问:您现在主要也是做技术研发是吧?

答:对,包括跟媒体合作。反正什么都会参与一点,但是稍微偏技术一点。

问:咱们融资情况方便透露一下吗?

答:我们之前融了天使轮和Pre A轮,所以我们正在融下一轮,A轮吧。

问:现在估值是多少?

答:这个再说吧,这个再定。所以这个其实对新闻应该也不是特别关键。

问:我只是好奇问一下,因为现在国内做VR的太多了。

答:对,是。我们应该还可以,不是说,我觉得VR估值其实现在受一定的影响,因为处于它没有大规模爆发,所以人没有一个很好的参照,所以这个估值其实上下浮动还是很大的。

问:而且我个人感觉现在相比于1、2月份比较冷淡。

答:比上半年。

问:比1、2月份。

答:那是那是。因为人的亢奋状态是不可能一直持续的,总会有波峰波谷,这个很正常。

问:像我看之前调查说有80%做VR硬件的公司已经转向做内容,做软件了,我不知道也影像,VR音频方面的创业者开始多起来还是?

答:比去年多一些,今天已经听说几个了,36kr就经常来问我,所以是多了几个,但还不是很多,因为这个行业比较小。

问:咱们目前来说是做音频属于比较早的是吧?

答:我觉得应该是比较早的,你可以从媒体上看应该是比较早的。不排除有一直默默在做,不露头的,当时创业公司可能稍微也得发声一下。

问:现在看全景视频公司比较多。就从声音来说,做全景视频这种声音跟做VR视频这种声音区别大吗?

答:还是有不小区别的。

问:主要表现在哪儿?

答:没有一个成熟的流程和标准。比如说传统做音频5.1或者立体声都有非常成熟的流程、软件,比如说Pro Tools在电影界,在音频制作用Cubase或其他软件,都很成熟了,但是在全景上,其实没有。前不久Facebook买的Two Big Ears其实主要买的是它的编辑器,它的编辑器其实就是一个Plugin,配合Pro Tools或者Cubase来使用。

后面的流程其实标准都没有,因为就在于传统的,无论你一百多轨事先我都混好,混成5.1或者立体声,但是现在360度有多种做法,你不混好,完全单做,然后用软件也能实时渲染,我一个新的方位,我就把这个声音渲染到那里,然后根据头部旋转我重新再渲染一遍。

所以这个确实跟传统的产品差别还是很大的。否则不会现在大家都做VR音频,专门IEEE包括国内的AVS标准都是专门为VR成立的会议。今天还在开呢,所以他们隔一段时间都在讨论,就是因为这一块还是非常空白的。

问:那像,如果全景视频跟VR视频本身我觉得是有区别的是吧?

答:我觉得其实我也看到了这些讨论,到底什么样才是真正的VR,我个人认为,我们也没必要那么偏激,其实如果说这个全景视频在沉浸式设备能给你一个沉浸感,比以前升级,你可以把它归结为泛整体的VR视频。

问:像咱们的音频技术对应的全景视频跟更加专业的VR视频上有什么区别吗?

答:我们肯定对应的视频希望至少是全景的,如果你只是180度前面加3D的话,那你就用普通的就可以,5.1、立体声就可以,因为如果你只是在前面那个视角,你就限定了大家的视角就是前边,你旋转头部所有的交互其实没有了。也可能就是说,如果他做的是景深,我在房间里位移,我可以把移动的东西加进去,但这个就还是比较偏传统,就是说就是一个面,所以这个就相当于跟以前的游戏,或者说影视其实差别不是特别大。

问:如果是引入的互动环节多,音频是不是就得再更上一层了。

答:对,其实我们现在做的就已经支持互动了,音频是肯定可以支持互动的。我们最基础的,现在是原点去旋转,跟这个陀螺仪角度我调整声音的角度,就像你调整视频的角度一样。如果是HTC VIVE你在一个区域可以移动,这个声音都可以变化,都是需要相应配合,这才是我觉得比较好一点的体验。我走到那个区域,或者发声越来越近,越来越近,声音越来越大。这一层算法上都可以做。

问:咱们现在已经开始在弄了?

答:我们其实算法都是可以支持的,只是我们现在拿不到Sensor那个数据,现在基本上更多的就是旋转,得到旋转我去调整声音的方位。但是远近距离的话,这个在声音上以前就有做过,因为以前可能是人不动,我要把远处的物体给它拉近拉远,但是其实声音处理的算法是一样的。但是确实你要做得特别好也挺难。所以这个,尤其越是细节,很多人不注意的地方,越是复杂度特别高,比如那些反射,你在墙角那个点反射,然后我要放在这个地方反射都不一样,所以这运算量还是挺大的。

问:现在在电影院主打那种立体环绕声那种概念,是不是已经有点全景音频的雏形了?

答:是这样,在杜比的话,我们叫Dolby Atmos,杜比全景声,他也就是说从原来的环绕声5.1升级到维度更高,加上头顶,他的目标也是把你包围起来,所有的四面八方的声音都有。

但是实际在影院里还不太一样,因为它配合的还是属于内容都是在前端,所以他有的时候其实不能充分的发挥声音的效果,而且就是为了配合这个画面都是在前面的这种感觉,它的混音方其实不是完全按照VR全景混音的,还是更多把人说话的声音放在前面,把所有环境声放到后面,其实混音的手法跟传统5.1还是比较接近的,顶多就是现在我加上高度了,可以把雷声、雨声都放在上面,有这个感觉。所以它的手法我觉得是介于VR全景和普通的之间,不是很彻底。

还有一个关键的问题就是说,他不需要实时的旋转,为什么?就是它直接就放一个扬声器,无论怎么做,都是放一个扬声器,其实就是他在我们在VR音频想模拟这个环境,这个场景。你戴上头盔以后其实就是想模拟,这个声音跟你在影院没戴耳机一样,无论怎么转,那个声音永远在那个方向发声,如果你不是VR的话,传统的立体声,那声音就随着你跑,所以就没有身临其境的感觉了。跟传统还不太一样,关键就是没有交互,不需要这个交互。

问:他看前面就够了。

答:对,而且观众无论怎么转,那个音响没挂在你耳朵上,所以你怎么转音响发声的位置一直在那儿,比如那边飞机、打枪总是在那个位置。但是你要是戴耳机的话,你用耳机听传统立体声,你要转到这边的话,原来在那儿发声会随着你转90度转到这个位置。所以就是说,这个是对的,尤其你如果都不是全景的,没关系,那大家就知道了,我听立体声,看视频都在这里,但是如果说你看视频是全景视频,我头转到这儿了,其实我看到这个内容已经不一样了,但是你声音没有变化,那这个就不对了。

问:那生理上看,视觉上有延迟会造成眩晕感,但是听觉上如果有延迟的话,生理上会造成什么样的负面反应呢?

答:那听起来沉浸感就没了。

问:那不会有什么排斥。

答:那不会有。就是听起来不太舒服,比如简单的例子,你上网看电影或者开视频会议的时候,声音画面不同步。

问:就是口形跟声音对不上。

答:对,一般经常出现的就是声音滞后很长时间,这个一般来讲我们声音稍微滞后一点还可以,就怕声音是提前的,那很痛苦,我这已经说完了,过一会儿看那人才动嘴。就是心情会受影响,但是还不至于像视频那样影响那么大。

问:那咱们现在主要跟硬件厂商合作比较多还是跟软件,或者跟互联网公司合作比较多?

答:现在我感觉一半一半。所以有几家硬件,因为我们的硬件包括前面的拍摄端,也包括后面的显示,拍摄端就是一体机,相机,它会用我们的收音方案。头盔厂商是用我们的播放方案。

问:那像软件是不是就直接集成你们那种算法。?

答:对,SDK。然后如果和软件平台去合作的话,我们可能会,比如说是开专区的形式,我们会甚至提供一些内容,就是用我们SDK做的内容,他就可以播。

问:很多人都说今年下半年VR这个领域该洗牌了,或者遇到一些寒冬。这个不知道您怎么看,或者如何应对这个寒冬?

答:这个洗牌确实有可能,就像O2O所有这种一开始大家都进入,肯定很快就没有C了,没有B了,可能马上就出局了。我个人觉得我们发展一年目前还好,所以一般创业公司我觉得一年也是一个坎。所以我觉得接下来我们现在钱也比较充足。

问:就是资金流都没有问题?

答:对,资金比较充足,因为我们财务的把控包括融资都还可以,所以下半年我们一点问题都没有。这是一方面。但是我觉得更关键的是你的产品,你的核心技术是不是有壁垒,是不是你对什么行业的理解,我觉得都有关系。所以我觉得除非这个VR行业倒了,那我们可能被迫去转型。但是我们沉浸式的音频技术是可以适用于很多方面的,所以你只要把握核心技术,我觉得其实应用场景非常广。就像我们做了很多年,VR也是有很多这种应用场景。

当然,我觉得以目前大家对VR的投入,我觉得短时期内肯定还会继续下去,因为我们一定要不断地打磨技术,真正看到哪天,现在其实还是属于爆发的前边,我觉得爆发已经可以了,我觉得现在的力度还是比我们预想的要快很多,这么多人投入硬件,投入软件,厂商投入,所以更新换代的速度非常快,在这个环境里面,你如果把握一些核心的技术,我相信你可以走得更远,从创业角度也会有更多的机会。这个我倒是目前还是比较有信心的。

问:咱们有没有什么计划,就是扩充团队规模?

答:我们也在缓慢地扩充。所以我们也是根据我们自身发展情况在慢慢地招人,但是招人其实是非常不容易的事,尤其招到特别好的,特别对的人。音频这个领域其实人挺少的。我们之前在大公司工作也是在国内都是体会很深刻的,不好招人,你在大公司都不好招,在创业公司就面临各种问题了。

问:在内容建设方面,咱们有没有考虑联合参与一些影视剧的发行之类的,比如说找一家做视频的公司给咱们做音频,然后咱们发布一些VR的影视剧,全景的影视剧之类的,这些有考虑过吗?

答:我有考虑,我们有合作方有影视方。

问:都是在进行中了?

答:是。

问:有考虑过独立制作内容?

答:对。我们肯定会借助于我们自有的音视频技术去和传统的影视方合作。我想现在没有谁想完全自己独立做,肯定都是大家互相合作共赢,我们是比较开放的。

问:那您觉得VR电影什么时候能得到爆发呢?

答:这个其实我觉得可能会比游戏要晚一点。

问:还要晚一点?

答:对,因为现在传统的影视方因为也在看,我们也合作了几个片子,我觉得还有可以上升的空间,大家具体展现的形式其实还是在摸索的,其实游戏也在摸索,但是我觉得做游戏相应的来说这个过渡过程相对自然一点,都是交互的东西,现在只是交互变成更多维度,360度,然后设计上为了避免眩晕可能要注意某些设计的方法。但是电影完全是改变第一人称,和传统的叙事手法还是完全不一样的。这个还是有挑战的。

问:如果说VR电影市场的爆发,我们做音频的用武之地就更大了。

答:对。电影的话就是因为它的一个传统行业,它不像游戏,我觉得电影更多是大公司,很多流程,包括软件都是一套,都是多年以来沉淀积累的这么一个流程,所以你要迎接一个新的方式其实还是时间比较漫长的。所以我觉得,比如说他用惯了Pro Tools,现在做5.1,现在有很多用5.1的朋友,你要做全景的话,可能就没用了,都用不上。所以你要开辟新的环境,这个还是挺难的。

但是国外有几个团队我觉得做得很不错,最近好像融资也融得特别好,Verse最近刚融了6000多万美金,所以他是做内容做得比较好的团队。Philips Pro是另外一个,他们都是最近几年先后发生的融资。所以他们做的内容非常好,我们也希望能够做出比较不错的精品。这个是我们努力的目标。

问:硅谷有没有做专业音频处理好的公司是咱们对标的呢?

答:杜比的总部就在硅谷,DTS也在硅谷,这是大公司。小公司的话,目前没有太听说过。

问:就是专门做音频处理的。

答:对,Facebook买了一个,然后谷歌买了一个,其他的其实还真没太听说,但是小音频公司真的很多,我们在杜比的时候也是看到一些小的音频公司,但他们可能都是专于某一个领域,传统领域,但是VR这一拨起来直接说我们VR音频的还真没有太多。有一个最近方瑞投的一家好像是从国外,但是好像也回国了,也是华人。

问:当时是不是一个挑战,就是从杜比出来做VR音频的创业,也想了很长时间?

答:对,肯定也在行业观察了很久,酝酿了很久,因为我们年龄比较大,出来创业对我们来说算是一个挺大的一件事,我们很重视这个事,所以真把这个当回事去做。

问:有一种放下了眼前的金矿去到更远处更大的金矿。

答:对,也不算是金矿,只是这个年龄需要做一些自己特别喜欢的事。

问:你应该是80后吧?

答:没有,我70后。绝对是70后的大叔来创业。

问:我觉得这个真的很难得可贵,70后有雄心壮志赶上创业的大潮。

答:对。所以其实我们就是因为在这个行业对音频这些算是有那么一点点前瞻性,就是你看到了这个行业将来发展什么样,你觉得VR音频有可能有一个比较大的机会,所以你就出去做了。所以这个如果你纯做技术的话,这个确实可能需要年龄的一些经验,一些积累,你如果是做一个社交的APP,这个其实年轻人反而更具有优势。

问:那像您在杜比老东家已经开始在做VR音频的研发了吧?

答:我们有设计。当时有一家公司做SDK,Jaunt VR,跟他们有合作。

问:像巨头进入这个领域,像您这种创业公司有没有一些担忧什么的?

答:我其实不是特别担忧,我觉得他有自己传统的行业方向,然后VR他们也,这个可能说太多也不太好,因为我本身其实当时就参与了这些,是大家在探讨这个东西,但是动作相对来说会慢一些,而且固有的技术不能颠覆,然后要维持基于已有的技术去做这件事,其实有时候可能不是最理想的选择。

问:像咱们完全可以从零开始,想怎么改怎么改。

答:对,所以我觉得在VR音频上,我个人觉得我们反而走得更远,走得更快,我们其实还是有很多这种机会的,优势,但是确实他如果重金砸下来全部做,那我肯定有竞争,但是竞争各行各业都存在。其实在这个行业,客观的讲竞争已经小于很多其他行业了,但是我们也不能掉以轻心,因为已经开始很多人在赶上了。

问:我觉得您选择VR音频这个领域,一个是您自己的专业对口。二当时确实可能没人太关注这个市场,您已经建立这种先发优势了,现在您是一个前面领路者。

答:也不能这么说,但是确实提前先发生,然后教育一下市场。

问:今天了解差不多了。

答:好。

问:音频这块确实不光是市场,我们媒体这边也确实不太重视音频。我今天了解了很多。

答:我们也是面对这个情况很多年,因为做音频毕竟都是视频为主,杜比其实我们也做视频,只是音频更突出。

本文被转载1次

首发媒体 腾讯科技 | 转发媒体

随意打赏

搜狐视频ceo扎克伯格vrvr视频vr游戏vr音频vr头盔vr资源vr技术vr眼镜
提交建议
微信扫一扫,分享给好友吧。