触景无限肖洪波——“感+知” 人工智能的刚性需求
一周前,Intel斥巨资收购以色列公司Mobileye,再一次让全球 人工智能 领域的焦点聚集在了前端感知上面。而长久以来,开发者们所面临的首要问题就是如何让人工智能更好地感知。
对于机器学习而言,感知过程需要在短时间内处理GB甚至TB级别的数据量,这首先就需要合适的算法模型(软件)、强大的运算能力(硬件)作为基础,并辅以大数据的支持。而当人工智能受限于使用环境而导致不能完全依赖算法及运算能力时,传感器的作用就显得更加重要。
触景无限——新一代感知平台更加友好
3月28日,在由葡萄创投主办的人工智能产业峰会上,触景无限科技 CEO 肖洪波发表《视觉感知与人工智能》主题演讲,并发布新品——基于双目立体视觉的嵌入式AI感知平台——视觉卡(Vision Card)二代。
作为一家致力于AR;前端感知技术开发的人工智能公司,触景无限提供了嵌入式人工智能感知一站式解决方案,此次发布的产品相较上一代在功耗、体积、性能、兼容性等几方面都有了不同程度的提升。
此次V20X视觉卡系列基于Intel提供的Movidius MA2450图像处理平台,具有效率高、适配能力强等优势,对开发者及后端的应用都非常友好,目前已经应用于无人机和 可穿戴设备 领域。
肖洪波告诉我们,在未来人工智能趋于成熟的大环境下,产业分工将会更加明确,一家公司至少要在某一个领域做到很高的水准。对于触景无限来讲,人工智能前端感知是他们的强项。
嵌入式的多传感器数据融合
针对传感器数据深度的过滤和融合,触景无限认为这是前端和后端处理都要考虑的问题,同时也是智能感知面临的第一个挑战。
“我们会碰到非常多的传感器,比如激光雷达、超声波雷达、压力传感器、GPS,TOF等。这些传感器在不同的情况下要满足用户的不同需求,它的数据要做一些深度的融合,比如刚才提到的无人驾驶、无人机,包括安防其他的行业。这些传感器怎么样能够把它的数据进行非常好的数据的过滤,包括通过数据源的方式对它进行数据的融合,这个是我们要考虑的问题。”
把产业链中的感知环节做到 极 致
触景无限最新推出的二代产品V203,其运算能力已经提升到了1Tflops,功耗低至2w,且体积只有5cm2(相较一代缩小了十倍)。便捷性的提升使其在无人机、安防等领域应用中能够表现得更加灵活。
肖洪波向Xtecher表示,以前做自动驾驶、无人机的企业,大多都从端到端开始——也就是说所有前后端模块和软硬件都要研发团队亲力亲为。但花费很大代价取得一整套成果后,中间技术可能也无法给其他厂商使用。
“我们是希望打破这种格局,在产业链中间做这样一个感知模组,让更多的创业公司或有志于转型的成功企业,可以把智能感知的能力赋予他们的产品。”
今年年初,触景无限刚刚完成了5000万人民币的A+轮融资。随着产业链逐步走向成熟,感知技术成为了人工智能不可或缺的刚性需求,同时人工智能的大众化、消费化趋势也更加明朗。
正如肖洪波所说:“无论是无人机厂商,或者其他传统行业的企业,如果愿意把你的产品赋予这种感知的能力,那么我们也愿意和你们一起去做行业的创新!”
以下为肖洪波发言原文整理:
大家下午好!我是触景无限CEO肖洪波,其实从我们公司的名字里面,大家可以看到我们其实是一家做传感器融合的一家公司,我们通过传感器帮助人类。今天上午一来看到一个非常严肃的话题,机器人什么时候取代人类?
今天我希望跟大家探讨的一个问题,就是人工智能和视觉感知方面它们是怎么样来结合的?
其实刚才我觉得李总讲得非常好,人工智能是一个数据处理的这样一个方法,说得更准确的一点,它是一个统计学的数据工具,通过统计的方式帮我们去做一些数值上的模拟和处理。
很多时候把视觉问题简化成了一个分类或者一个识别的问题,但实际上视觉里面涉及到非常多的细节的问题。它主要涉及了5个大的领域,包括颜色、光照、形状、移动还有距离。这几个处理在视觉皮层中是同时并行的处理。其实从五官里面看和力学一样,有经典力学和量子力学,在经典力学很多规则在量子力学完全没有办法使用的。
视觉系统和力学系统类似,力学分为经典力学和量子力学,两者有着截然不同的规则。目前我们研究视觉系统主要通过很多宏观的理论,其实还有很多微观的理论去解释,比如说当我们看到一个东西的时候,在产生视觉刺激在前150毫秒的时候,我们这5个神经系统处理功能会有非常微妙的时间差,即并行又相互作用。通过研究这些视觉问题,如何让机器也可以拥有这样的视觉,这可能是我们希望解决的一个问题。
还有一块非常重要的环节,在前端的感知,在嵌入式的视觉里面,怎么样能够把更多的传感器,像刚刚看到的和我们前面看到的数据做深度的融合。比如视觉传感器,它在白天的时候可能很好,可能晚上根本没有办法使用;比如TOF在室内可能很好,但是在室外光线的影响下可能什么东西都不能识别。
就像我刚刚提到的,感和知、看和理解是同时发生的。如果放在服务器上处理,时间是非常慢的,没有办法在前端做实时的反馈和处理。所以感和知这两个事情本身来讲,它是同一个命题,如果是同一个命题它带来什么样技术上的挑战?我想这一块是我们要思考的一个问题。
现在嵌入式的智能感知已经在一些行业里面形成了一些应用,智能感知是把很多的领域结合在一起,比如说多传感器在前端的融合和记忆视觉、深度学习,这些领域的技术结合在一起提供给终端产品来使用。
但是现在这些产品做的多数是端到端的产品,比如它有自己的芯片,有自己的算法,从头做到尾。我们认为随着人工智能的发展,会出现非常大的产业分工。大家在各自领域提供不同的解决方案,把擅长的东西融合在一起,为用户提供更加有效的解决方案。
智能感知里面我们首先面临的挑战,就是多传感器的数据融合。这一块我们会碰到非常多的传感器,比如说激光雷达、IMU、超声波雷达、超声、高速测量的这种压力传感器,还有GPS、TOF。这些传感器在不同的情况下要满足用户的不同需求,它的数据要做一些深度的融合。
刚才提到的无人驾驶、无人机,包括安防等其他行业,这些传感器怎么样能够把它的数据进行非常好的数据的过滤,包括通过数据源的方式对它进行数据的融合,这个是我们要考虑的问题。
另外一点在智能感知整个的解决方案里面,我们的深度学习是在前端的嵌入式端来运行的。在做深度学习的过程中,我们倾向于把网络做的越深越好,因为这样的话可能能够识别更多的图片。比如说有做上千层的这种深度学习网络,但是我们在嵌入式上面临的一个挑战,就是说我们的资源是有限的,我们没有办法去跑特别大的这些模型。
第三它的实时性要求可能比我们后端的服务器处理还要高,比如我们无人机在飞行过程中,我需要一秒钟至少20到30帧的处理速度,能够判断周围的环境,能够避障,我降落的时候希望降落到水里面,去识别周围的环境,识别水面。怎么样在前端嵌入式系统里面能够对这个神经网络的模型来进行踩点和压缩,是嵌入式的智能感知面临的非常大的课题。
所以我们采用的是嵌入式的芯片,这两代芯片都是在嵌入式上做处理的芯片。在过去的三年里面,我们一共研发了6款产品,这这些产品都是针对嵌入式去做智能感知的。
比如我们母板里面都会集成现在市面上大家能看到的传感器,包括像双目的摄像头、TOF都会在我们母板里面有集成,同时包括驱动里面数据的过滤。针对不同的行业,我们会有不同行业定制的版本。比如针对于安防有专门针对安防的版本,或者说一些智能的装备,比如客户需要圆形的产品,我们要把这个板定制好以后可以放到他产品里面。
视觉卡V203功耗会更低,它的面积是5平方厘米,相当于一个1元硬币的大小。这么大的一个开发板,上面可以集成所有你想要的传感器。
我们还在这两个嵌入式芯片基础上,开发了一个智能感知的平台,就是一个软件平台。我们希望在整个的产业链里面可以帮助到很多终端的产品、公司。
以前很多终端产品公司他们都要做端到端的产品解决方案,从芯片选型开始到算法的这种移植,到怎么样整合这些传感器,一直到最后的产品里面。我们希望我们提供这样一个中间的平台可以提供给产品的开发商,可以让他们比较简单的就把传感器的这个功能,或者说智能感知的这个功能嵌入到他们的产品里面去。
我们线上还提供算法库的支持,这个算法库有我们自己的,也有全球研究所的。我们和中科院也有联合的嵌入算法的处理。底层的话,我们会把这些传感器都集成到这个硬件平台上来,包括这些定型的芯片,包括网络的接口,包括WIFI、USB等等这些产品。
V203是我们做的最小的一个模组,它可以接大家想要的传感器,在前端帮你去做处理,包括刚才提到的就像人的眼睛一样。前端通过定型的数据能力,可以去做颜色、距离、形状这些的处理。
我们希望未来能够向这三个方向:第一个是更加小型化——我们的第二代产品相较于第一代体积缩小了10倍;功耗从15W降低到了2W;运算能力从300G提高到1Tflops。
触景无限致力于为大家提供一个嵌入式的智能感知解决方案,所以我们非常希望和我们的合作伙伴一起将智能感知的能力嵌入式到你的产品里面,无论是无人机、安防、或其他任何传统行业的企业,如果你愿意给你的产品赋予这种感知的能力,那么我们也愿意和你们一起去做行业的创新,谢谢大家!
<