VR变默片还有劲吗？时代拓灵CEO认为VR音频应当与视频同等重要

腾讯科技 • 8年前扫码分享

VR次元孙实管慕飞 7月6日报道

当我们描述一部优秀的VR作品时，常常会说“我好像真能看到飞机从我头顶飞过”，或是“我好像真的在森林里漫步”，却很少会说“我能亲耳听到飞机的轰鸣”、“我能听到忽远忽近的鸟叫”。

比起影像，VR音频带来的沉浸感可能更为“隐性”。在时代拓灵的CEO孙学京看来，VR市场尚需教育，用户没有刻意去注意声音，但并不代表声音对内容的帮助不存在。

时代拓灵的创始团队是一群资深的老摇滚乐迷。或许正是出于对音乐的执着，在VR音频还没有像视频技术那样引起重视时，他们就先人一步进入市场。目前，公司已经完成天使轮和千万级Pre-A轮融资，目前正在进行A轮融资。

“从展现形式来讲，传统的视频确实很关键，而且都是先想到视频再想到音频。当时确实意识到音频的重要性会提升一些，所以我觉得这是一个契机。”孙学京对VR次元表示。

VR音频应当与视频同等重要

什么样的音频称得上是VR音频？孙学京认为，通俗来说，就是用户在现场实际能听到的声音，即能带来临场感的声音。“比如说在酒馆里的一个场景，大家在讨论，喝酒，各种聊天的声音，你在那儿你听的声音就应该是你觉得在现场的声音，而且要和视频无缝对接。”

从技术上来说，就是用算法来模拟声音的反射。例如模拟房间里声音的反射，那么用户相对于声源的距离、角度，都会成为影响最终输出结果的参数。

然而，相比视觉上的模糊、失真等问题，用户对声音的远近高低似乎没有那么敏感。对此，孙学京也承认这是客观存在的，但他同时认为，好的音频确实可以大大提升用户体验。

“如果你是特别好的内容，一个做个非常好的声音会让你觉得整个画面刻画得都很自然。如果声音没有，那其实你会觉得某些方面有些缺失，但是可能普通人就没有意识到，或者他也说不出来具体是哪不够完美。”

他甚至认为，在VR内容当中，音频是视频应当处于同等重要的地位。

完善的VR音频是和细节在较劲

或许在外行眼中，VR音频就是普通音频加上一套用以处理信号的算法，但在孙学京看来，前后声音是否能很好地区分、混响大小模拟是不是足够好、戴耳机和没戴耳机的效果是否相似等等细节问题，都是决定一段音频是否完善的要素。

VR与传统视频或全景视频所采取的音频技术的不同之处就在于，VR音频必须支持互动，而引入的互动环节越多，技术的复杂程度也就越高。“如果你只是180度前面加3D的话，那你就用普通的就可以，5.1、立体声就可以，因为如果你只是在前面那个视角，你就限定了大家的视角就是前边，你旋转头部所有的交互其实没有了。”

孙学京解释道，现在最基础的互动就是用户的头部围绕原点旋转，这就像视频角度会随着陀螺仪角度的调整而调整一样，音频也必须做出相应的配合。

孙学京说，其实这些算法都是可以支持的，在人不动的情况下把视觉上的物体拉远拉近，这样的算法早已有之，而声音的处理其实是一样的，“只是我们现在拿不到Sensor的数据……但是确实你要做得特别好也挺难，尤其越是细节，很多人不注意的地方，比如那些反射，你在墙角那个点反射，然后我要放在这个地方反射都不一样，这个运算量还是挺大的。”

此外，由于时代拓灵主打的是移动端，因此不能像杜比这些公司一样在音质上追求极致，还要兼顾音频在移动端播放的效果，孙学京表示他们也设置了许多平衡点。

巨头早已开始行动，孙学京：并不担 心

去年，谷歌 ( 微博 )收购了专门为VR打造现实音效的初创公司Thrive Audio；今年5月， Facebook 宣布收购VR音频公司Two Big Ears；另据孙学京透露，他的老东家杜比也在做相关的研究。

但孙学京表示并不担心，他认为这些巨头有自己传统的行业方向，“动作相对来说会慢一些，而且固有的技术不能颠覆，然后要维持基于已有的技术去做这件事，其实有时候可能不是最理想的选择。”

目前，时代拓灵已经在软硬件两方面同时与一些企业展开了合作。软件方面，主要是以提供SDK的形式，甚至是直接提供内容。

孙学京认为VR音频市场的竞争相比其他行业要小，但也不能掉以轻心。时代拓灵一定程度上走在了前面，但巨头的前进速度也不容小视。

附采访实录：

问：咱们是哪年成立的？

答：2015年5月份。但是我们认识很早了，总公司注册的话就是5月22号。

问：当时是基于什么样的背景决定从这个领域来切入到VR呢？

答：因为我们在杜比工作，所以一直做的就是音频视频，所以这个跟专业视频相关的就是跟我们做的是很相关的，VR其实核心就是一个娱乐升级体验，当然还有一些其他的行业业务，当然VR里面比较核心的展现形式就是视频，还有其他游戏，这个其实杜比主营业务跟我们一直从事的行业是非常相关的。

然后本来我们又是喜欢做跟娱乐、跟视频相关的事，所以就找到一家公司，给他展示这个，我记得第一次看的是Jaunt VR那个Paul McCartney的演唱会，就是一个全景视频给他看，他看了还是觉得非常不错。因为我们之前在讨论别的创业项目，跟这个相关的，这个其实是生化结合还是非常不错的。做一些Demo，都觉得这个展现形式挺好的。又是演唱会，又是我们喜欢的事，想去做，所以就一结合，是顺理成章的。

问：您大学专业学音乐还是音频制作出身的吗？

答：不是，我大学本科其实学的是心理学。只是那会儿大家都喜好音乐，而且本科做了一个项目其实是跟语音识别、说话人识别、声音处理相关的，所以后来出国也是做声音的。

问：就是个人爱好就是影音、视频这种，后来研究生出去进修。

答：对，博士出去学习也是跟声音处理相关。

问：当时做这个项目是觉得视频要发展起来，但是音频大家都不太重视吧，我觉得包括到现在好像很多人都对这种VR音频不是特别重视是吧？

答：对，这个毕竟从展现形式来讲，传统的视频确实很关键，而且都是先想到视频再想到音频。当时确实意识到音频的重要性会提升一些，所以我觉得这是一个契机。而且本身确实也是很关键的一环。这个确实，我们成立公司的时候肯定很多人还没有意识到这一点，今年其实情况已经改观很多了，也陆陆续续有其他的音频的公司，大家在讨论这个事。但是相对肯定会比视频讨论的会少。

问：在您眼中觉得一个完美，或者比较完善的一个VR音频应该具备哪些要素，就是我在看一个VR视频或者全景视频的时候，这个音频能给人们带来哪些比较好的体验？

答：其实从音频上和视频是一样，我们就想给你带来一个身临其境的感觉，然后你听到这个声音，你就是在现场听到的声音，这是一个比较通俗的说法，比如说在酒馆里的一个场景，大家在讨论，喝酒，各种聊天的声音，你在那儿你听的声音就应该是你觉得在现场的声音，而且要和视频无缝对接。

所以具体从技术层面讲，我们就会考虑一个声源范围是不是定位比较精准，你的音质是不是和原来的音质是保持一致的，因为经过一些信号处理，算法肯定会对音质有些损害，如果是好的算法应该是保持它的音质。然后你的这种效果其实不是表面性的，展现性的，而是如果像素高，跑起来就会卡，这个其实不能接受。

所以在人听的话，这个其实对空间上的听的感觉也是很复杂的。基本上用比较口语化的那就是是不是方位、远近这种音质都是符合的。然后再具体一点，再复杂一点，我们会用专业的词说叫出头感，externalization，就是你戴耳机听的时候是不是好比你没戴耳机。其他细节，前后，比如我们在做三维声音的时候，有遇到前后的confusion，就是前面的声音和后面的声音区分不是特别开，这都是很多细节的东西。包括混响大小模拟是不是足够好，噪音需要去掉。

问：因为技术上我不太懂，比如视频肯定是视觉的，相对于视觉，人类的听觉的灵敏度比视觉还要敏感吗？

答：你是指哪些方面？

问：比如视觉有没有身临其境的感觉，就是我一眼就能感觉出来。但是听觉方面，是不是身临其境，他耳朵能有那么敏感，灵敏度能分辨到底是不是身临其境，就是对本身的用户体验来说影响很大吗？

答：我觉得可能会不像视觉那么直观，这个确实是客观存在的。但是如果你特别好的沉浸感，就好比你去影院，如果这个音响特别好，包围感特别好的话，那其实会大大提升你的体验。因为我们做音频，我们认为声音是非常重要的。经常包括电影大师卢卡斯，包括国外的一些大师都会说，传统VR里面声音都是非常重要的，50%，我觉得在VR音频里，VR内容里更是50%以上。

所以如果你是特别好的内容，一个做得非常好的声音会让你觉得整个画面刻画得都很自然。如果声音没有，那其实你会觉得某些方面有些缺失，但是可能普通人就没有意识到，或者他也说不出来具体是哪不够完美，可能是这一种，不是像视频上，这有个黑点，画面不清晰，大家很容易联想到一些词，或者有经验怎么来形容。

但是如果声音缺失，就有可能说不是特别过瘾，就好像沉浸感不是最理想的情况，但是他又具体说不出来，但是实际你如果点他一下，这可能是声音处理的不是特别好，跟现场的声音不是特别一样，这可能其实他也能够反应上。所以我觉得更多的是属于传统的这种对大家的教育上，当然大家没有过分的去注意声音，但并不代表他对内容的帮助不存在，我是这么理解的。

问：那咱们时代拓灵在这个音频上做了哪些改进，或者技术上有哪些优势？

答：我们主打是这种移动端，然后我们无论从音质、复杂度、跨平台，就是说是做一个工业级的商用的解决方案的话，我们其实考虑还是比较全的，不光是考虑音质，比如说我们以前在杜比可能特别追求极致，但是到了出来做公司，我们做移动端，尤其移动端我们要兼顾它的效果，所以我们做了很多最好的平衡点，就是应该达到什么样音质，达到什么效果。我们在这上做了很多工作。

问：PC VR、移动VR跟一体机参数细微的差别有什么？

答：PC这块肯定用户量要大，人群覆盖率比较大，这其实跟图像都是一样的，为什么很多游戏可以在PC VR上跑，在手机VR上就跑不动，就是这个道理。音频也是一样，我们有很复杂的算法可以把场景模拟得特别逼真，但是到移动端就要做一些，通过把这个复杂度降下来，把一些高复杂度的运算做一些牺牲。但是这些希望对音质不会造成太大的影响。

问：咱们主打移动端VR，跟现在很多手机上都有移动VR了，像华为、乐视，包括之前的暴风魔镜，这个跟他们都有一些合作吗？

答：我们正在开展，签了很多协议。

问：那像咱们这个VR音频对什么硬件有什么要求吗？或者换句话说，现在有很多音质很好，但是由于耳机的问题导致本身的音频，别再由于他们硬件上的一些问题。

答：耳机是一个因素，但是现在只要不是特别山寨的耳机都应该还可以，比如Iphone的耳机其实做的质量都不错。

问：但我是指，能不能因为他们的VR硬件不成功，导致你们的VR音频展现不出应有的效果，这点有没有担心？

答：这个一般我觉得还好，因为我们都是软件渲染，所以如果是软件渲染通过耳机的播放，它的整个里面处理，除非它做得特别差，否则的话我觉得应该还好。

问：对硬件的要求不高是吧？

答：硬件要求不高，我不要求它有什么特殊的芯片，其实就是软件算法。当然得比较高效，还是高端机。还是有一定要求，比如我们用三星S6和小米4，其实是有差别的，因为它们对声音的处理，它们对Sensor的处理是不一样的，比如华为终端机华为和小米，华为它的这个陀螺仪就比三星S6的陀螺仪质量要差，所以你会发现经常你做跟踪的时候，它这个结果就不是特别精准。反正像三星S6质量做得不错，还是有一定的影响。

问：您指的就是说整个移动式VR，包括手机，手机对你的声音影响大还是本身这个VR产品对声音的影响大？

答：我觉得应该是手机的影响。

问：手机影响更大。

答：对，我们比较关注的有几点是，比如一些Sensor数据我们拿得特别好，Audio处理平台是不是足够高效，因为我们特别怕延迟特别高，处理声音我们叫缓冲，声音处理这个小的Subsystem如果做得不是特别好，优化得不是特别好，可能会导致延迟比较高。这个我们发现不同的形式不一样。所以如果真是做得特别好，确实需要深度的订制。这也是为什么三星VR做得好，就是它对三星S6做了深度的订制，他的头盔也做了比较好的外设，交互。

问：在录一些现场演唱会的时候，您这个VR音频怎么用，因为现场可能收声就是那样，声音本来就那样。

答：这是特别好的问题，我们做VR音频我们也做收音端，我们希望从收声一直到播放，其实我们都想参与，如果说现场录的音质比较差，那我们只能从后期做一些加工，做调整，也有一些软件补救的办法，但是确实你要从收音源头端把握好，这个跟相机、视频处理都是一样的。

问：我看消费者，VR展现的主要就是影视，游戏什么的。咱们现在主要是给的是侧重于影视还是游戏这方面？

答：目前两个都有客户感兴趣，我们在推，尤其从SDK角度。但是影视可能会稍多一些。

问：是因为觉得游戏的VR这个音频处理难度更大还是觉得这个市场比较小？

答：这个跟我们推广的，就是说我们侧重点可能有点关系，并不觉得它需求比较低。做游戏的人可能他们都是在PC端，PC端可能用已有的传统SDK满足它的需求。但是确实现在也有游戏，包括一些教育，一些课件在询问跟我们合作。其他的这种影视方其实也是因为我们自己在做一些影视内容，所以从头到尾，导致我们目前看起来似乎推声音的合作方也是较多。但我觉得其实都是一样的，甚至我们还有做社交的，就是在最近开始做。

问：像咱们做VR音频主要还是2B端，跟供应商合作。

答：对，设备厂商，平台播放器这种。

问：跟咱们这个跟消费者直接对接还是目前有点遥远是吧？

答：对，我们通过消费者对接都是通过中间的一些应用，比如APP或者硬件，通过他们跟终端对接，先2B，然后通过他们2C。

问：我第一次接触VR音频是看到，当时业内有特别轰动性的，英伟达出一个很牛逼的。

答：Works。

问：对，他到底牛逼在哪儿？

答：我（具体）没有听过，也没有用过，他只是宣传过。我们目前都有尝试过，就是说把很多音频处理用GPU处理，他其实做了很多工作，还是为了卖他的GPU，他把很多很复杂的声音处理通过GPU来实现，比如说房间的反射，发声的声源，我在房间里走来走去，我通过我和声音的远近，位置不一样，我听到的声音因为是不一样了的，所以这个运算复杂度非常大。

问：我站在这儿听到的声音和在那边听到的声音不一样。

答：没错，所以这个算法模拟这个房间，所以就要先构建一个房间模型，然后这个声音要用数学模型在房间里反射，其实理论上有无数个点，但是数学上一定要精简。所以算这个东西就需要非常高效的处理器，你采的点越密，越精细，理论上效果越好。所以你如果是能够高效的算，通过GPU这肯定是非常好的事情。

问：他那个技术可能更适用于PC VR或者立体VR。

答：我个人是目前这么认为。

问：回到团队这方面。咱们现在团队大概多少人？

答：二十几个人。

问：都是主要以技术为主？

答：对。

问：像跑市场，品牌这块部分，就几个人是吧？

答：对，我们有两个员工，一个终端，一个市场，人很少。

问：您现在主要也是做技术研发是吧？

答：对，包括跟媒体合作。反正什么都会参与一点，但是稍微偏技术一点。

问：咱们融资情况方便透露一下吗？

答：我们之前融了天使轮和Pre A轮，所以我们正在融下一轮，A轮吧。

问：现在估值是多少？

答：这个再说吧，这个再定。所以这个其实对新闻应该也不是特别关键。

问：我只是好奇问一下，因为现在国内做VR的太多了。

答：对，是。我们应该还可以，不是说，我觉得VR估值其实现在受一定的影响，因为处于它没有大规模爆发，所以人没有一个很好的参照，所以这个估值其实上下浮动还是很大的。

问：而且我个人感觉现在相比于1、2月份比较冷淡。

答：比上半年。

问：比1、2月份。

答：那是那是。因为人的亢奋状态是不可能一直持续的，总会有波峰波谷，这个很正常。

问：像我看之前调查说有80%做VR硬件的公司已经转向做内容，做软件了，我不知道也影像，VR音频方面的创业者开始多起来还是？

答：比去年多一些，今天已经听说几个了，36kr就经常来问我，所以是多了几个，但还不是很多，因为这个行业比较小。

问：咱们目前来说是做音频属于比较早的是吧？

答：我觉得应该是比较早的，你可以从媒体上看应该是比较早的。不排除有一直默默在做，不露头的，当时创业公司可能稍微也得发声一下。

问：现在看全景视频公司比较多。就从声音来说，做全景视频这种声音跟做VR视频这种声音区别大吗？

答：还是有不小区别的。

问：主要表现在哪儿？

答：没有一个成熟的流程和标准。比如说传统做音频5.1或者立体声都有非常成熟的流程、软件，比如说Pro Tools在电影界，在音频制作用Cubase或其他软件，都很成熟了，但是在全景上，其实没有。前不久Facebook买的Two Big Ears其实主要买的是它的编辑器，它的编辑器其实就是一个Plugin，配合Pro Tools或者Cubase来使用。

后面的流程其实标准都没有，因为就在于传统的，无论你一百多轨事先我都混好，混成5.1或者立体声，但是现在360度有多种做法，你不混好，完全单做，然后用软件也能实时渲染，我一个新的方位，我就把这个声音渲染到那里，然后根据头部旋转我重新再渲染一遍。

所以这个确实跟传统的产品差别还是很大的。否则不会现在大家都做VR音频，专门IEEE包括国内的AVS标准都是专门为VR成立的会议。今天还在开呢，所以他们隔一段时间都在讨论，就是因为这一块还是非常空白的。

问：那像，如果全景视频跟VR视频本身我觉得是有区别的是吧？

答：我觉得其实我也看到了这些讨论，到底什么样才是真正的VR，我个人认为，我们也没必要那么偏激，其实如果说这个全景视频在沉浸式设备能给你一个沉浸感，比以前升级，你可以把它归结为泛整体的VR视频。

问：像咱们的音频技术对应的全景视频跟更加专业的VR视频上有什么区别吗？

答：我们肯定对应的视频希望至少是全景的，如果你只是180度前面加3D的话，那你就用普通的就可以，5.1、立体声就可以，因为如果你只是在前面那个视角，你就限定了大家的视角就是前边，你旋转头部所有的交互其实没有了。也可能就是说，如果他做的是景深，我在房间里位移，我可以把移动的东西加进去，但这个就还是比较偏传统，就是说就是一个面，所以这个就相当于跟以前的游戏，或者说影视其实差别不是特别大。

问：如果是引入的互动环节多，音频是不是就得再更上一层了。

答：对，其实我们现在做的就已经支持互动了，音频是肯定可以支持互动的。我们最基础的，现在是原点去旋转，跟这个陀螺仪角度我调整声音的角度，就像你调整视频的角度一样。如果是HTC VIVE你在一个区域可以移动，这个声音都可以变化，都是需要相应配合，这才是我觉得比较好一点的体验。我走到那个区域，或者发声越来越近，越来越近，声音越来越大。这一层算法上都可以做。

问：咱们现在已经开始在弄了？

答：我们其实算法都是可以支持的，只是我们现在拿不到Sensor那个数据，现在基本上更多的就是旋转，得到旋转我去调整声音的方位。但是远近距离的话，这个在声音上以前就有做过，因为以前可能是人不动，我要把远处的物体给它拉近拉远，但是其实声音处理的算法是一样的。但是确实你要做得特别好也挺难。所以这个，尤其越是细节，很多人不注意的地方，越是复杂度特别高，比如那些反射，你在墙角那个点反射，然后我要放在这个地方反射都不一样，所以这运算量还是挺大的。

问：现在在电影院主打那种立体环绕声那种概念，是不是已经有点全景音频的雏形了？

答：是这样，在杜比的话，我们叫Dolby Atmos，杜比全景声，他也就是说从原来的环绕声5.1升级到维度更高，加上头顶，他的目标也是把你包围起来，所有的四面八方的声音都有。

但是实际在影院里还不太一样，因为它配合的还是属于内容都是在前端，所以他有的时候其实不能充分的发挥声音的效果，而且就是为了配合这个画面都是在前面的这种感觉，它的混音方其实不是完全按照VR全景混音的，还是更多把人说话的声音放在前面，把所有环境声放到后面，其实混音的手法跟传统5.1还是比较接近的，顶多就是现在我加上高度了，可以把雷声、雨声都放在上面，有这个感觉。所以它的手法我觉得是介于VR全景和普通的之间，不是很彻底。

还有一个关键的问题就是说，他不需要实时的旋转，为什么？就是它直接就放一个扬声器，无论怎么做，都是放一个扬声器，其实就是他在我们在VR音频想模拟这个环境，这个场景。你戴上头盔以后其实就是想模拟，这个声音跟你在影院没戴耳机一样，无论怎么转，那个声音永远在那个方向发声，如果你不是VR的话，传统的立体声，那声音就随着你跑，所以就没有身临其境的感觉了。跟传统还不太一样，关键就是没有交互，不需要这个交互。

问：他看前面就够了。

答：对，而且观众无论怎么转，那个音响没挂在你耳朵上，所以你怎么转音响发声的位置一直在那儿，比如那边飞机、打枪总是在那个位置。但是你要是戴耳机的话，你用耳机听传统立体声，你要转到这边的话，原来在那儿发声会随着你转90度转到这个位置。所以就是说，这个是对的，尤其你如果都不是全景的，没关系，那大家就知道了，我听立体声，看视频都在这里，但是如果说你看视频是全景视频，我头转到这儿了，其实我看到这个内容已经不一样了，但是你声音没有变化，那这个就不对了。

问：那生理上看，视觉上有延迟会造成眩晕感，但是听觉上如果有延迟的话，生理上会造成什么样的负面反应呢？

答：那听起来沉浸感就没了。

问：那不会有什么排斥。

答：那不会有。就是听起来不太舒服，比如简单的例子，你上网看电影或者开视频会议的时候，声音画面不同步。

问：就是口形跟声音对不上。

答：对，一般经常出现的就是声音滞后很长时间，这个一般来讲我们声音稍微滞后一点还可以，就怕声音是提前的，那很痛苦，我这已经说完了，过一会儿看那人才动嘴。就是心情会受影响，但是还不至于像视频那样影响那么大。

问：那咱们现在主要跟硬件厂商合作比较多还是跟软件，或者跟互联网公司合作比较多？

答：现在我感觉一半一半。所以有几家硬件，因为我们的硬件包括前面的拍摄端，也包括后面的显示，拍摄端就是一体机，相机，它会用我们的收音方案。头盔厂商是用我们的播放方案。

问：那像软件是不是就直接集成你们那种算法。？

答：对，SDK。然后如果和软件平台去合作的话，我们可能会，比如说是开专区的形式，我们会甚至提供一些内容，就是用我们SDK做的内容，他就可以播。

问：很多人都说今年下半年VR这个领域该洗牌了，或者遇到一些寒冬。这个不知道您怎么看，或者如何应对这个寒冬？

答：这个洗牌确实有可能，就像O2O所有这种一开始大家都进入，肯定很快就没有C了，没有B了，可能马上就出局了。我个人觉得我们发展一年目前还好，所以一般创业公司我觉得一年也是一个坎。所以我觉得接下来我们现在钱也比较充足。

问：就是资金流都没有问题？

答：对，资金比较充足，因为我们财务的把控包括融资都还可以，所以下半年我们一点问题都没有。这是一方面。但是我觉得更关键的是你的产品，你的核心技术是不是有壁垒，是不是你对什么行业的理解，我觉得都有关系。所以我觉得除非这个VR行业倒了，那我们可能被迫去转型。但是我们沉浸式的音频技术是可以适用于很多方面的，所以你只要把握核心技术，我觉得其实应用场景非常广。就像我们做了很多年，VR也是有很多这种应用场景。

当然，我觉得以目前大家对VR的投入，我觉得短时期内肯定还会继续下去，因为我们一定要不断地打磨技术，真正看到哪天，现在其实还是属于爆发的前边，我觉得爆发已经可以了，我觉得现在的力度还是比我们预想的要快很多，这么多人投入硬件，投入软件，厂商投入，所以更新换代的速度非常快，在这个环境里面，你如果把握一些核心的技术，我相信你可以走得更远，从创业角度也会有更多的机会。这个我倒是目前还是比较有信心的。

问：咱们有没有什么计划，就是扩充团队规模？

答：我们也在缓慢地扩充。所以我们也是根据我们自身发展情况在慢慢地招人，但是招人其实是非常不容易的事，尤其招到特别好的，特别对的人。音频这个领域其实人挺少的。我们之前在大公司工作也是在国内都是体会很深刻的，不好招人，你在大公司都不好招，在创业公司就面临各种问题了。

问：在内容建设方面，咱们有没有考虑联合参与一些影视剧的发行之类的，比如说找一家做视频的公司给咱们做音频，然后咱们发布一些VR的影视剧，全景的影视剧之类的，这些有考虑过吗？

答：我有考虑，我们有合作方有影视方。

问：都是在进行中了？

答：是。

问：有考虑过独立制作内容？

答：对。我们肯定会借助于我们自有的音视频技术去和传统的影视方合作。我想现在没有谁想完全自己独立做，肯定都是大家互相合作共赢，我们是比较开放的。

问：那您觉得VR电影什么时候能得到爆发呢？

答：这个其实我觉得可能会比游戏要晚一点。

问：还要晚一点？

答：对，因为现在传统的影视方因为也在看，我们也合作了几个片子，我觉得还有可以上升的空间，大家具体展现的形式其实还是在摸索的，其实游戏也在摸索，但是我觉得做游戏相应的来说这个过渡过程相对自然一点，都是交互的东西，现在只是交互变成更多维度，360度，然后设计上为了避免眩晕可能要注意某些设计的方法。但是电影完全是改变第一人称，和传统的叙事手法还是完全不一样的。这个还是有挑战的。

问：如果说VR电影市场的爆发，我们做音频的用武之地就更大了。

答：对。电影的话就是因为它的一个传统行业，它不像游戏，我觉得电影更多是大公司，很多流程，包括软件都是一套，都是多年以来沉淀积累的这么一个流程，所以你要迎接一个新的方式其实还是时间比较漫长的。所以我觉得，比如说他用惯了Pro Tools，现在做5.1，现在有很多用5.1的朋友，你要做全景的话，可能就没用了，都用不上。所以你要开辟新的环境，这个还是挺难的。

但是国外有几个团队我觉得做得很不错，最近好像融资也融得特别好，Verse最近刚融了6000多万美金，所以他是做内容做得比较好的团队。Philips Pro是另外一个，他们都是最近几年先后发生的融资。所以他们做的内容非常好，我们也希望能够做出比较不错的精品。这个是我们努力的目标。

问：硅谷有没有做专业音频处理好的公司是咱们对标的呢？

答：杜比的总部就在硅谷，DTS也在硅谷，这是大公司。小公司的话，目前没有太听说过。

问：就是专门做音频处理的。

答：对，Facebook买了一个，然后谷歌买了一个，其他的其实还真没太听说，但是小音频公司真的很多，我们在杜比的时候也是看到一些小的音频公司，但他们可能都是专于某一个领域，传统领域，但是VR这一拨起来直接说我们VR音频的还真没有太多。有一个最近方瑞投的一家好像是从国外，但是好像也回国了，也是华人。

问：当时是不是一个挑战，就是从杜比出来做VR音频的创业，也想了很长时间？

答：对，肯定也在行业观察了很久，酝酿了很久，因为我们年龄比较大，出来创业对我们来说算是一个挺大的一件事，我们很重视这个事，所以真把这个当回事去做。

问：有一种放下了眼前的金矿去到更远处更大的金矿。

答：对，也不算是金矿，只是这个年龄需要做一些自己特别喜欢的事。

问：你应该是80后吧？

答：没有，我70后。绝对是70后的大叔来创业。

问：我觉得这个真的很难得可贵，70后有雄心壮志赶上创业的大潮。