苹果透漏人工智能研究新方向：图像识别

物联网的那些事 • 8年前扫码分享

据外媒报道，苹果日前发布首份关于人工智能(AI)的学术论文，其中主要描述了在计算机视觉系统中提高图像识别的方法，这标志着苹果终于透露了其人工智能研究的全新方向。

苹果透漏人工智能研究新方向：图像识别

其实对于图像识别技术，大家已经不陌生。由于涉及个人隐私问题，虽然在电视机和空调上，无法直接应用图像识别技术，但是在冰箱上的应用，却很早就受到长虹美菱、海尔，以及美的等家电巨头的认可和推动。但目前市场化商用的力度并不大。

苹果发布的首份关于人工智能(AI)的学术论文，主要描述了在计算机视觉系统中提高图像识别的方法，在机器学习研究中，使用合成图像进行神经网络训练要比真实图像更有效。原因在于合成图像已经被标记和注释，更加省时省力。举例来说，眼部或手部的合成图像都有自动注释，而描述类似物品的真实图片算法并不熟悉，因此需要人类操作员进行描述。

当前人工智能软件在各个领域，正变得必不可少。它几乎被应用到所有的应用程序中。运用人工智能技术，无论是图像识别，还是语音识别，正变得越来越准确，这包括机器能准确识别语音、语义甚至静态的图片以及动态的视频。

如在智能家居领域，通过摄像头获取到图像，然后通过图像识别技术识别出图像的内容，从而做出不同的响应。举个例子，我们在门口安装了摄像头，当有物体出现在摄像头范围内的时候，摄像头自动拍摄下图像，对图像进行识别。识别后如果发现是个人，并且长时间在门外并没有敲门进门等行为之后，就可以及时报警给户主。或者，在夜晚的时候发现有物体移动，对物体进行识别，如果是可疑的物体就主动报警。

当门口的摄像头识别到人之后，再进一步的对人像在进行面部识别。如果能和主人的面部匹配上，就为主人主动开门。还有现在家庭里的智能机器人，通过图像识别技术对物体进行识别，并且实现对人的跟随。搭配上人工智能系统，它能分辨出你是它的哪个主人，并且能你进行一些简单的互动。比如检测到是家里的老人，它可能会为你测一测血压;如果是小孩子，它可能给你讲个故事。

事实上图像识别元不仅如此，图像识别可分为生物识别、物体与场景识别和视频识别。据估算，到2020年生物识别技术市场规模将达到250亿美元，5年内年均增速约14%。其中，人脸识别增速最快，将从2015年的9亿美元增长到2020年的24亿美元。

在物体与场景识别中，机器视觉是一个重要的部分。预计2018年，全球机器视觉系统及部件市场规模达到50亿美元。视频识别主要用于安防产业，我国未来5年总体年增长率仍将保持在20%左右，到2020年有望达到万亿元。

随着各领域对于身份识别和验证的精确度要求的提高，基于图像识别技术的人脸识别和视频识别技术在金融、安防、医疗、无人驾驶等领域迎来了发展机会。

而随着图像识别技术的发展，高性能的AI计算芯片、深度摄像头和优秀的深度学习算法也在为推动图像识别向更深处发展提供源源不断的动力。AI底层架构从CPU+GPU到FPGA，再到人工智能专用芯片，运行表现不断刷新。

深度摄像头的开发也加强了前端获取深度信息的能力，为后端数据处理带来了极大的便利。另外随着以深度信念网络(DBN)和卷积神经网络(CNN)为代表的深度学习算法在图像识别中的广泛应用，图像识别的准确率得到了很大的提升。

ImageNet比赛图像识别中对象分类项目准确率从2010年的72%提升到了今年的97%，可谓实现飞跃发展。图像识别获得了快速发展，应用产品层出不穷，成为人工智能应用的急先锋。刷脸支付、机场自助通关、增强现实、无人驾驶等都是图像识别技术快速普及的一个缩影。