借助嵌入式视觉方案,阅面科技让消费级产品智能升级成为可能
最近阅面科技CEO赵京雷在接受36氪采访时表示,阅面正在做一款面向消费级产品的图像识别嵌入式硬件模块,该模块已经融合各类底层算法,提供即插即用的基于深度学习的视觉解决方案。国外也有一些嵌入式视觉方案商,诸如pilot.ai等。通过廉价的运算单元(如Arm)在终端设备上部署,不依赖于云和额外的GPU等,使得深度学习在消费级产品大规模应用成为可能。
赵京雷表示选择消费级产品切入市场的原因在于,基于共有云的AI开放服务市场,未来是BAT的战场,它们能够提供免费的服务,创业公司可以做的事情少;而视觉与垂直领域结合的市场(例如医疗图像分析、安防公安等)尽管机会大,但在数据流打通,数据采集,不仅仅是技术层面的事情,而且已经有许多家上市公司在做。
在赵京雷看来,视觉算法在消费级市场的大规模应用是一片蓝海并且具有爆发性增长空间。对于消费级产品的升级改造,无论是传统家电、智能硬件、摄像头还是无人机、机器人 、VR/AR等新兴设备,由于移动互联网红利爆发影响,以前大多是APP操控,不够智能与人性化,而人工智能可以赋予它们更强的智能认知和交互能力,帮助其提升用户体验。
例如任何一个摄像头都有可能通过嵌入式视觉算法升级成为一个智能化图像传感器,能够本地实时的采集、感知、分析、反馈图像信号,具有对人和空间识别的能力,在此基础之上就能够帮助智能主体进行判断,以此来完成主动感知和认知。
为面对消费级产品,阅面提出了软硬件一体的模块化嵌入式解决方案。
阅面已经自主研发实现人脸识别、表情识别、手势识别、人体姿态识别、空间识别等等一系列底层深度学习算法闭环,融合优化后的典型算法安装包只有5M大小。如果一个机器人公司需要多个算法,就不需要融合多家供应商的SDK ,避免了平衡功耗、集成、重复计算、资源协调等等麻烦,阅面也会根据行业需求选择不同的算法提出模块化解决方案。
嵌入式技术则节省了消费级产品的空间与成本,这些深度学习视觉算法可以在低至1G的Arm芯片上实时运行,举例来讲,其本地人脸识别和追踪算法在1.5G Arm 单核CPU上能达到100帧/秒。基于整体的硬件视觉模块,多算法更能相互配合,即插即用。本地化处理也让在网络环境无法得到保证的现在,不依靠昂贵的服务器以及GPU、FPGA等加速设备。用廉价芯片跑实时AI算法不仅降低了功耗,成本,而且识别准确率也不低于云端,更加符合消费级产品的实际场景。
现阶段的用户主要是机器人、IOT、IPC行业,图像识别是一个全球化的市场,公司现在不仅有公子小白、奇沃智能、葡萄维度这样的大量国内用户,也在拓展美国市场,目前已有两三家。据赵京雷估计今年硬件视觉模块出货量将达到10万级,SDK接入的设备将达到百万级。
出于对算法的重视,阅面团队的40个人中有三分之二都是算法工程师。CEO赵京雷以前在阿里巴巴曾负责算法团队和相关算法产品的研发,CTO Leon以前在卡内基梅隆机器人研究所做副研究员。
最近比较火的地平线是一家阅面的竞品公司,不过在赵京雷看来,尽管在项目早期两家产品部分相似,不过随着公司发展,阅面将会是一家算法驱动的解决方案公司,而地平线将会成长为一家提供芯片的硬件厂商。因为针对消费级市场,也让其与海康、大华这些做监控的民用市场厂家有所区别,而在未来阅面与它们更多的是合作互补的关系,阅面的前端实时处理能力将为它们带来算法精度和性能上的提升。