眸瑞科技CTO夏宇翔:寒门难再出贵子,中国难再出技术
2017年4月25日,由长沙眸瑞网络科技有限公司主办的 老子云 移动现实云服务平台全球发布会在北京国贸大酒店召开。本次发布会以“实现”为主题, 眸瑞科技 董事长李韬、眸瑞科技CTO夏宇翔,同全球 人工智能 学术界和产业界著名学者、顶级专家和业界精英、图形图像领域顶尖级工程师和科技领域资深媒体人等百多位各界友人一起,见证老子云这一属于中国人自己的底层技术系统的创新与应用。
长沙眸瑞网络科技有限公司 CTO夏宇翔就“ AMRT技术 ”分享了他的看法,以下是夏宇翔的主要观点提炼:
1、寒门难再出贵子,中国难再出技术;
2、 3D模型技术 可构建一切数字世界;
3、导致3D技术“叫好不叫座”的原因;
4、压缩技术的应用;
5、“老子云”的定位是 技术服务 、 资源共享 ;
以下是眸端科技CTO夏宇翔现场演讲速记整理:
欢迎大家能够参加“老子云”的发布会。感谢李总和我的团队给我这样一次露脸的机会。
今天上这个台,一开始我是拒绝的。因为从幕后到台前,我觉得我还有很长的时间需要去做适应。在德国的几年,我和我的团队从来没有想过今天会以这么一个方式在北京和大家见面。
发布会前夕,我们将我们的技术演示录成了视频,就是想告诉大家 AMRT技术 已经做到这样了,大家可以一起来了解一下。可是结果引起了很多的质疑,还真的应了那句老话, 寒门再难出贵子,中国再难出技术 。
急功近利让中国的创新举步维艰,山寨汽车、山寨手机,甚至是山寨的景点,让我们这些做底层技术创新的更加难上加难。 一项技术的推出,大家首先不是选择怎么了解和参与,而是选择不相信。我很欢迎大家的质疑。反过来,从某一个维度来讲,至少证明AMRT在技术领域上还是存在很强的先进性,或者是争议性。
我叫夏宇翔,我是一名 从事图形图像底层算法研究的普通的程序员 。这样的我和大家有什么不同呢?你们眼中的我可能是这样子的,可能是设计部的同事认为这只猴子更能够体现建模技术。而我眼中的我是什么样子呢? 从这边2D图形到那边的3D模型,它的建造过程就是从建模再到灯光、制作,然后到贴图、材质、渲染,最后合成一个立体图形。 这个模型可以通过指令进行编程,它就可以做相应的动作。所以,从专业的角度来讲,我的同事把我的照片换成这只猴子,从建模的角度来讲,我们没有太多的区别。
通过3D的数字模型技术,现在可以构建一切数字世界,也能还原一切现实世界,甚至可以百分之百还原出整座城市。
在各行各业的应用,Google是基础的老大,开发了很多开源项目。通过Google地球对东京整座城市进行了建模,你可以快速穿插在东京的各条街道,甚至可以打开门走进某个房间。
目前,3D模型技术在这么多年的技术推动下,在社会上得到了广泛应用,尤其是虚拟现实的出现,对于模型的需求越发的大和广。
在工业领域,现在可以通过3D建模技术,能够虚拟一条生产线,让原来的工厂从2D的图纸变成3D的数字化管理。
在军事上,能够让战士在虚拟的战场上体现真实的战斗场景,可以提高专业技能。
在房产领域,近几年,大量的房产公司推出了VR看房、3D看房业务,吸引顾客购买。
在影视领域,最近有一部动画片《攻壳机动队》,就是由3D和后期的CG动画制作而成的。
游戏领域就更不用说了,今天在场有很多年轻人,我们耳熟能详的《魔兽世界》等等一大批3D模型游戏已经在全球风靡很多年。
不过,现在的3D模型数字技术的绝大部分应用还是停留在简单的展示与交互上。 对于一些深层次的应用,对于模型的物理仿真就涉及到大量的 运力算法, 与智能设备的连通来构建物联网,构建一座与现实世界平行的虚拟世界,这样一条技术探索之路,还需要很长的时间,才能完成最终设想。
截止到2016年10月份,3D数字模型技术的相关内容在百度上有1.8亿多条的技术 ,尤其是各大媒体的争相报道,我们觉得活在当下真的很幸福,不管是想的到的,还是想不到的东西,都有可能接触得到。 2016年被称为VR技术的元年,很多VR技术层出不穷,VR的游戏、VR的视频,大家接触了很多。虽然2016年被称为VR虚拟现实元年,我们的调查结果虽然是创业者众多,但目前的市场占有率不到1%。
目前3D技术的输出方式,我们总结了一下为什么会造成叫好不叫座的现象?我们总结了几条。
首先是设备性能 。大量的模型应用是基于PC端,在应用搭载设备的过程中,大多是基于PC以及比较大型的智能设备上,比如大家都知道的XBOX、PS。因为硬件天生的不足,移动性比较差,便携性也是非常差的,这导致我们的前期市场投入造价很高。对于做模型的前期市场要应用,获取模型的速度会很慢,代价会很高。获取了模型以后,为了展示,在PC上还相对好一点,因为现在有很多建模的技术都是基于PC端去做的。但是,对于其他跨平台的应用,市面上的软件和开发平台就是微乎其微的,导致后期的制作费用也非常高。所以, 我们总结现有的技术还不能完全满足市场需求。
目前移动端的市场占有率仅仅只有3%,而 3D模型技术在移动端的输出的市场是很大的,而且是很有作为的 。2016年,全球智能手机用户已经超过20亿,用户对于日常设备的依赖性越来越有这样一种趋势,就是 取代PC ,社会上出现了“低头族”。只有1%的用户会选择在移动端上进行3D应用。
基于这些现象的研究,我们提出了一个大胆的设想, 能不能将效果精美、运行流畅的3D模型在手机上呈现呢?要实现这个目标,我觉得是困难重重的。 四年前,李总第一次跟我聊天时就涉及到这个问题。那个时候,我心里也没底。因为四年以前的移动端设备,无论是CPU,还是GPU,远远达不到现在的水平。这里面主要哪些困难呢?
一是在性能上,移动端CPU、GPU的运算速率,内存与存储单元远远比不上PC端。 建出来的模型很大,就会导致资源包在转化的过程中出现装不下的现象;
二是现有的建模软件,尤其是应用开发软件,大部分都是基于PC的 ,投入到移动端的应用开发软件是微乎其微,而且标准的不统一会导致格式之间的转换,各种模型的转换非常烦琐,需要大量的中间转换件,而且还存在不兼容的问题;
三是软件迭代过程中,编码模式发生改变,就会造成很多资源占用。 PC还有另外一个问题,就是光影和算法无法直接移植到移动端使用 ,大量效果在移植的过程中被阉割掉了,最直接的就是影响客户的观感体验,根本没办法在商业上应用;
四是网络受限,不足以支撑模型传输,小的几十兆,大的上百兆。
AMRT这个技术到底解决了什么样的问题?
我们花了四年时间,一直研究一个东西,解决了移动端数字实物的展示与交互的相关技术。为了让大家更直观地了解现在的技术达到什么程度,下面有请我的助手上台,我们首先看一个案例。
这是湖南长沙洋湖湿地的一个别墅小区。我们在房地产公司的电子沙盘上看得很多,但真正把电子沙盘做到手机端上的非常之少,我都没见过。现在通过这样一项技术,可以通过建模,把洋湖湿地这个小区里的所有楼盘都展示出来。
大家的第一个直观感受可能是3D全景地图。我的同事从这个地方穿过去,这也是告诉大家如果是图片,它是不可能进行穿插的。
刚才在进来的时候,对于光的还原,我们也做了大量的效果移植,能够达到PC上的水平,包括水的反光、光的阴影、折射、漫反射,都可以呈现出来。
为什么可以通过AMRT实现这个技术?
首先是这么一个大型的模型,为什么能够在手机上展示?这归结于我们的一个核心 压缩技术 。 AMRT的压缩技术是针对于模型文件、贴图文件、材质球、动作脚本、灯光的相关文件进行了压缩与优化。 我们做过测试,PC上1G的资源包,通过最大的输出比,压到移动端大概是60M左右,压缩率高达6%。通俗一点来说,可以把1G的内容压掉94%,只剩下6%。这也使我可以把所有楼盘的模型都建模出来。
我为什么刚刚说是最大压缩比 ?是因为通过这种方式,我们可以对压缩比进行弹性的设置。 在手机上,如果要求性能好,肯定要损失一些效果。效果好,可能就会损失性能。所以我们做了一个弹性设置,针对于各行各业,或者是用户对各个模型的需求,可以进行弹性调整。
刚刚我们看到的光影还原,为了实现这个效果,需要光影算法的跨平台还原技术。 所有的光效算法在PC端都是基于OPENGL标准的。我们在PC上看的效果非常逼真,但一旦到了移动端,它就被阉割掉了。通过我们的 光效还原算法 ,可以很快的让PC端的光效在移动端上得到最大限度的还原。
在走动的过程中,它都是带贴图和渲染的效果呈现,这是基于分布式全景烘焙技术。用一句话来概括, 我们做到的是分布全景烘焙,单体是做了单个渲染的,集中去烘焙整个场景。通过这个技术,可以让效果及时输出。 不像传统的建模行业,大家都设计过房子,都出过效果图。设计师拿着CAD图,拿出模型,在上面做效果,之后再推到渲染服务器上,需要很长时间,才能针对某个视角渲出一张图,而我们的效果是及时呈现的。刚刚在移动端就是对它进行拍照,就能输出效果。
通过这些技术的融合,才能够呈现今天这个案例的效果。
“老子云”的定位是技术服务、资源共享。我想从三个方面跟大家分享,服务、API应用、云市场。
首先是服务。“老子云”的服务归结为一句话,可以为全行业提供3D数字模型移动端的展示和交互的全套解决方案。 包括3D数字模型的建模、云烘焙、平台化的定制服务、模型的云存储和云调用服务、能够为二次开发者部署以AMRT的API衍生出来的产品、AMRT的技术支持和技术培训服务。
API应用 。通俗来讲,API就是将技术点结果化,可以让大家快速的进行调用。我们现在已经将刚刚讲到的三个技术核心API化,大家可以在熟悉API的体系之内进行调用。
通过API,可以更好规范行业标准。 实话说,在建模行业很多标准是不规范的。每个地区的CAD图和3D模型的制作过程都是不标准的。我们希望可以通过API的调用为规范标准做一些贡献。通过3D模型移动化构建全行业的自动化产品,提高效率,简化工作流程,降低用户的使用成本。
对于全行业的大规模应用,官方“老子云”输出很多自动化 。现有的是提供两个自动化。对于小的行业,可以通过社会力量,培养一大批技术粉丝,他们可以基于对API的了解,他知道了行业规则,就可以给某个行业解决自动化的问题。
AMRT技术最先开始接触的行业就是房地产 。因为我们的投资人对这个领域是很了解的。我们做出了两个解决全行业问题的自动化。最开始我们做了3D到移动端的自动化转化,可以将处理好的3D模型、户型、家具,通过自动化可以快速的在移动端上呈现。但是, 在商业落地的时候我们发现了一个巨大的问题,就是模型的收集。 为了解决这个问题,我们花了几个月的时间,组织攻关,做出了2D到3D的自动化服务。
通过两次的CAD户型图的对比。我们的自动化,在CAD转3D的服务上,至少可以在室内部分干掉建模师的工作。在室外部分,现在有90%的工作是可以替代的,只有10%还需要人工进行标识。
现在这些服务已经云平台化,而且API化,大家可以很容易的调用。二次开发者可以基于自动化,做很多的插件,包括CAD快速生成模型插件。
第二个自动化 ,现在做出了模型,要输出到移动端,它的后期加工过程还很长。通过融合现有的关键技术做出了3D到移动端的自动化,加上房地产行业对模型的要求规则。输出的模式, 第一个是PC端,也可以输出安卓的资源调用,也可以输出iOS的资源调用 。在应用层面开发方面,只要导入工程文件,后面可以添加动作脚本。上传上去是一个白模,我们上传以后会变成带有贴图和灯光的模型。通过点击压缩模型,可以预览生成完的格式。
通过这样两个自动化,可以支持商业应用。 如果不在技术上做迭代,就很难进行商业落地 。基于这些考虑,我们做了这样一个应用。我们当时想的是怎么用这些自动化来锤炼AMRT的技术,寻找出一些新的技术拓展点。这个是一家为应用场景的应用化系列的产品, 城市、家、商城这三个模块都是基于AMRT技术衍生出来的。
“城市”这个模块主要是针对房地产公司的一种应用 ,可以把大量小区的电子沙盘推到这个APP上。用户可以快速看到这些电子楼盘。
“家”这个模块是为设计师和用户的沟通打通的一个平台。 这样的设计软件在市面上是有的,但它要装一个包到PC上。对我们来讲,只要登录网站,输入登录号就可以,所有操作都是很随意的。可以保存方案,可以看鸟瞰图。针对设计好的方案,可以快速生成施工图、效果图。通过PC,设计师可以跟用户在手机上进行实时沟通。设计师可以通过这个平台,快速的向用户展示设计方案。
通过这样三个模块,可以对以“家”为场景的产业链进行全方位的技术支持,后期也可以接入大量的应用化服务,像街区规划、物业管理系统等等都是可以对接的。
下面给大家介绍一个工业方面的应用。 我们的案例主要是想展示几个方面, 一是仿真交互,二是解决末端销售的展示问题,再加上场景化的嵌入。 比如我是做机械设备的,我已经获取了厂房规划图。我们买设备的时候,用户就可以直接把设备图拖到厂房规划图里,可以组装成生产线。至少在前期建这条生产线的时候就有一个很直观的了解。
通过光影技术,可以看一下在PC上还原的效果。这个面数是非常大的,有200多万个面。这个模型是可以拉出来的,发动机的参数可以快速显示,包括它的结构。 通过这样的方式,可以很直观,而且带有很强的操作性、交互性,可以为C2F奠定非常好的应用软件的场景。 大家可能有一种错觉,觉得这是一个CG动画。实际上它根本就不是CG动画,我可以随时移动它的视角。
我们的第二项服务是云市场 。“老子云”不但是要提供全方位的云市场服务,用户可以通过云市场解决两个方面的问题, 一是二次开发者可以将自己的技术提供给其他用户进行使用。 我们可以给你们提供云平台的部署方案,只要你提供自动化脚本,我们就可以解决云部署的方案。基于我们的平台,开发者可以获取更多的利益,让自己的技术成果得到最大的价值化。
二是通过云市场,可以打通上下游的资源替换 ,就像我刚刚举的例子,以“家”作为场景的应用平台。买完房子,就肯定要搞装修,搞完装修就得买家具。
“老子云”本身还提供资源共享。
“老子云”的孵化器,通过提供 云计算 、云存储服务,给各大平台提供API化的技术开源。 以技术作为串联,融合上下游行业资源,搭建海量的数据化模型。打通行业全产业链,完成对行业的孵化。讲到模型库,大家就会想到安全问题。讲到自动化,我可以为你转,我也可以为他转。安全问题是怎么考虑的? 针对一些特殊行业有严格的保密要求,我们会提供专有的传输通道和专有的转化服务。 既然我们提供了服务,肯定是要收费的。
在今明两年,我们会做这些事情,为什么有这么大的跨度? 原因基于两点,一是市场需求,可能会提前,也可能会延后。二是针对潜在竞争对手的战略调整,可能也会提前,也可能会延后。
我们今明两年已经确定在两个方向上发力, 一是3D模型的搜索引擎 。只需要通过一张照片,用户就能够快速地找到模型。 二是3.0的融合技术。 本来我们应该有一个更严格的定义,叫“耦合”。我暂且称它是融合技术。
行业孵化方面,李总讲得很详细,我们已经跟深圳固高,也就是大疆无人机的母公司达成了战略合作,今年会针对工业领域推出相关平台。
我们做了一个很底层的技术,对硬件和网络的要求是很大的。 这一两年,我们会着重的打造基础设备,为大家提供更好的部署和资源调用服务。
谢谢大家的耐心聆听,谢谢大家!