微美全息视觉AI走“芯”赋能5G时代五大场景应用
5G时代触手可及,万物互联将不再是梦想,诸多行业将发生极大变革。据了解,机器视觉产业将迎来黄金发展期,根据Markets and Markets的统计数据,2017年全球机器视觉市场规模已突破80亿美元,并预计道2020年达到125亿美元,2025年将达到192亿美元,同时,据中商产业研究院整理,2018年中国机器视觉市场规模已超过100亿元,预计2019将达到125亿元,2023年将达到197亿元。在人工智能带来的诸多产业升级价值中,基于视觉交互的智能解决方案在智能化体系中占比80%以上。微美全息AI视觉作为机器视觉的关键之一,越来越成为人工智能交互的重要力量。
AI产业化发展到如今,行业内外对机器视觉的重要意义已经达成了共识。而存在于这个产业周期中最主要的问题,是机器视觉作为一种体系化的通用技术能力,如何与差异化明显、产业规律相对复杂的垂直行业相结合,让机器视觉从安防产业走向更多产业场景的深处,推动机器视觉从产业的外部辅助力量,走向真正的生产系统核心。
作为全息视觉领域的领军企业,微美全息(WIMI.US)专注于计算机视觉全息云服务。微美全息覆盖从全息计算机视觉AI合成、全息视觉呈现、全息互动软件开发、全息AR线上及线下广告投放、全息ARSDK支付、5G全息通讯软件开发、全息人脸识别开发、全息AI换脸开发等全息AR技术的多个环节,是一家全息云综合技术方案提供商。
微美全息在全息3D视觉软件领域有着深厚的技术积累,拥有上百个相关专利和软件著作权。通过多年的原创研发,微美全息团队开发的光场全息技术产品,其光场芯片显示的仿真度在全息领域让人叹为观止。微美全息其研发的3D视觉光场芯片,拥有自主知识产权,打破国际垄断,锻造出一颗“中国芯”。根据Frost & Sullivan的数据,微美全息在国内所有全息AR解决方案提供商中建立了全面、多元化的全息AR内容库,在收入、客户数量、全息AR内容以及全息AR专利和软件著作权数量方面,微美全息均在中国全息AR行业排名第一。
算法研发是一个不断迭代、精心打磨的过程,工业界和学术界最大的区别是学术界希望创造更多的算法,追求更多的是新颖性和创造性,而工业界追求的是系统的功能、性能、稳定性指标,并不要求发明最新颖的算法,而是要依据业务需求和资源限制做出最好用的系统。在工业界进行算法改进,包括很多维度,如数据如何处理、数据规模和来源,参数设置、模型结构,还包括损失函数设计,模型加速算法等,每一个因素都可能对最终结果影响很大。还有非常重要的一点是,需要从系统角度去解决问题,比如设计新的系统处理流程,比如把问题定义为检测问题还是识别问题。
对于如此多的算法模型,如果每个模型都需要不断迭代,同时要支持不同硬件平台的不同版本,在研发人员和训练硬件资源受限条件下,如何持续打磨核心算法是一个很大的挑战。传统的算法开发模式,算法工程师往往提起数据标注任务,由数据标注员标注完成数据标注,但算法工程师需要关心如何开发标注工具、如何培训标注人员、如何转换数据格式、如何提纯标注完的数据,最后再手工方式在一台物理机上将模型训练出来。
微美领先的全息AR内容制作功能围绕图像采集、对象识别、自动图像处理和计算机视觉技术而构建。微美的软件工程团队和可视化设计团队紧密合作,不断推进这些可视化相关技术,并利用它们设计和生产创新的全息AR内容。通过提供精确姿态估计的实时计算机视觉算法,能够在几秒钟内执行场景识别和跟踪。这种尖端算法还允许微美以像素为基础执行照片级真实高分辨率渲染的可视化。Frost&Sullivan表示,虽然大多数同行公司可能会识别并捕获特定空间单位内的40到50块图像数据,微美可以收集的数据块数量达到500到550;微美的图像处理速度比行业平均水平提高了80%,从而提高了运营效率。在场景重建过程中,微美的自动图像处理工具可以对最初拍摄的图像进行噪声清除和特征增强,从而能够创建具有业界领先模拟度的同类最佳全息AR设计。
微美的全息图像处理功能定期进行优化和改进,包括两项核心技术:全息AI面部识别技术和全息AI面部变化技术。由于视频处理和识别技术的发展,微美基于图像检测、识别、模板匹配、图像动态融合和替换的全息AR广告和全息成像服务目前在行业中处于领先地位。
5G网络提供了便捷,高速,高带宽,低延迟,高可靠性的数据传输通道,这点对于机器视觉来说很有意义。通常,图像传感器的数据量都比较大。如果没有高速,高可靠性的网络,这样的数据量就只能在终端直接处理,限制了信息的处理和交互能力。
在5G网络的支持下,可以把数据发送到云端,能够实现更加复杂的运算并且实时返回结果,比如在抗疫情期间,5G和视觉的结合让人们都当了一次“云监工”。微美全息其 商业 应用场景主要聚集在家用娱乐、光场影院、演艺系统、商业发布系统及广告展示系统等五大专业领域。
机器视觉与行业场景从浅层融合走向深度耦合,从辅助能力走向生产核心能力的过程中,确实可以看到产业和技术急需升级的诸多因素。走向巨型市场的过程里,机器视觉并非一把金钥匙,而是需要不断磨砺、提升与再造的产业起点。比如说,我们可以看到从在机器视觉走向产业核心层的过程里,有这样几个突出问题需要被攻克:
1、在机器视觉能力快速覆盖了基础场景,为各行业提供了主动识别、主动标记等基础能力之后。其价值却不足以匹配更深层次的产业需求。在深度行业需求里,我们看到机器视觉能力需要与更多技术脉络进行深度融合,例如传感器技术、热成像技术、光伏技术等等,以此适应更复杂、多元化、富含挑战性的行业场景,让视觉智能走向全息智能。
2、今天机器视觉的软硬件环境,处在高速发展阶段。以机器视觉融合行业需求,还需要在技术发展趋势中更新产品与解决方案体系。比如5G到来,提供了大带宽、低时延的网络基础设施迭代,这将带给行业机器视觉以全新的想象力。5G机器视觉设备也就成为了新的市场需求空间。
3、机器视觉走向行业,必须要满足具体的垂直需求与定制化场景,任何一家厂商都无法满足庞大的需求。因此必须构建 手机 应用市场一样的算法模型流通空间,借助各行业开发者的创造力满足垂直场景需求。
全息云业务将与5G深度结合,在5G的高速率与低延时的协作下,远程通讯与数据传输,从系统终端到业务服务器传输时延平均6ms左右,远低于4G网络传输时延,保障了全息AR的远程通讯与数据传输中的无卡顿、低时延,以及多终端异地协同,时交互的丰富性和多样性。使得端+云协同的协同更加高效。增强型移动宽带(eMBB)和物联网(IoT)应用,使得微美全息云的全息AR广告业务与全息AR娱乐业务,以及全息互动娱乐、全息会议、全息 社交 、全息通讯、全息家庭全息等,都将基于5G+AI人脸识别技术和全息AI人脸换脸技术的核心技术获得有效增长。
机器视觉是智能世界的眼睛,是万物感知的入口。随着5G的普及,延时将会进一步降低,最大限度的预留响应时长,进一步增强控制需求和安全操作;作为软硬件一体的解决方案提供商,赋能行业合作伙伴,帮助客户降本增效,互动体验更佳。