AI 赋能 AR 眼镜,亮亮视野是怎么做的?
亮亮视野 CEO 吴斐
1 月 17 日,发布会结束后,有媒体同行一见到亮亮视野的 CEO 吴斐就问,“听说你们前几天帮警察找到了嫌疑犯?”,吴斐笑着说,“对,但这些事不怎么能宣传,我们也没对外说。”
这天下午,他们发布了一款新的 AR 眼镜 GLXSS ME,用户可与手机或其他终端相连,可直接在手机屏幕或者终端按键进行操作,在一些场景中也可使用固定的手势进行操作。
从外观上看,新产品跟上一代 GLXSS Pro 没有特别大的区别,长相类似于 Google Glass 的穿戴设备,采用单目摄像头。但吴斐告诉雷锋网 (公众号:雷锋网) ,GLXSS ME 最大的提升有两方面,一是 AI,另一个是在行业的深度应用。
关于 AI 方面,GLXSS ME 采用了 Movidius Myriad 2 芯片,吴斐表示,相比传统架构,其计算性能提升了 10 倍,而功耗仅为 1/5。基于该芯片,他们研发出可适配主流训练框架的神经网络推理框架,这使得计算性能又提升了 2.25 倍。
为什么会使用 Movidius 的芯片,吴斐说,“这是大势,AR 是增强现实,你把数据与现实做结合,就要有计算”,双方 2016 年曾在 CES 结识并产生了合作意向。
基于强大的计算能力,GLXSS ME 可进行前端人脸物体的采集和识别,据吴斐介绍,人脸检测在 FDDB 库(全世界最权威的人脸检测评测平台之一)上,100fp 达到 92.8% 的准确率;人脸识别在 LFW(麻省大学计算机视觉实验室维护的一套公开数据库) 准确率达到 99.4%。
用矿泉水跌落的速度来检测识别的速度
除了硬件外,GLXSS LIVE 远程指导平台主要是面向企业的操作平台,像运维场景可实现远程教学与协作。现场吴斐介绍,由于没有适合于 AR 传输的协议架构,第一视角的远程传输面临很大的挑战。
为此,他们研发了可以传输 AR Streaming 的协议,将 GLXSS LIVE 底层的流媒体平台架构升级为 AR Streaming 的双流架构,把特征流和视频流独立开来,增加新的数据流传输闭环,实现双向 AR 互动。最大的不同是,传统的视频数据是以帧为单位、静态的,而 AR Streaming 的数据是以对象为核心的,每个对象都是独立的、可交互的。
另一方面则是行业应用。目前,他们已经服务于通讯、制造、医疗、工程、交通等行业的一些企业,其中包括与必维国际合作,研发远程联合检验平台,实现全球员工与后台专家及时沟通;与宣武医院合作,将北京专家与丽江基层医生和当地居民相连通,实现远程会诊和急救。吴斐称,“最初只是远程运维,现在有专家呼叫、AR 知识库和物联网的结合,还有底层的 AR Streaming 协议,我们的产品已经越做越深,而且是多维度的协同”。
吴斐透露,2017 年亮亮视野服务的大中型企业达 100 家以上,国内外业务比例约为 2:1,客户全年共完成远程指导 180,000 次,节省成本 84 亿元。对于 2018 年,他们预计服务大中型企业将扩展到 500 家以上。
不过对于 2017 年的产品出货量,吴斐表示,“我们担得起批量出货这四个字,客户基本要直接到我们库房里取货。”
成立于 2014 年,吴斐算得上是最早一批的 AR 从业者,雷锋网了解到,亮亮视野在 2015 年 2 月获得猎豹移动和经纬中国数百万元天使轮投资,在 2016 年 4 月获经纬中国领投的数百万美元 A 轮投资,在 2017 年 5 月,获得来自由蓝驰创投领投的千万美元 B 轮融资。
对于过去三年的行业变化,他说自己越来越乐观,“最悲观的时候已经过去了”。他说,“ 2014 年、2015 年热的是 VR,大家分不清 VR 和 AR,但二者的技术路径特别不一样,这说明大家只关注热度并不关注事件本身。我们在很长的一段时间内做的都很辛苦,因为客户也要花很长时间才能明白你到底提供的是什么价值,甚至包括投资人。今天我们有很多的一线公司对 AR 理解已经很深刻了,而且有自己的布局。”
2017 年 12 月低,明星公司 Magic Leap 终于公布了产品渲染图,有的外媒评价说,Magic Leap 就是为了让大家“勿忘我”。雷锋网编辑曾一度怀疑,这种单目的智能眼镜到底能不能被称为“AR 眼镜”?不过,现在看起来,这个问题似乎没有太大的意义,毕竟能解决市场需求的产品就是有意义的。而与 Magic Leap 为我们展示的技术美景相比,这样智能眼镜正在真实地变革着各行各业。
。