苹果iPhone X 发布,第一部人工智能意义上的手机
雷锋网 (公众号:雷锋网) AI科技评论:昨晚凌晨一点,号称是科技界春晚的苹果发布会如期而至,此次共发布了3款iPhone手机,命名也与之前曝光的信息相符,分别为iPhone X、iPhone 8和iPhone 8 Plus。
其中iPhone X作为苹果十周年的创新性产品出现。不可否认的是,iPhone X发布之前的爆料信息都非常准确,像传闻的全面屏、取消Home键、3D面部识别扫描也都在昨晚被一一证实。
尽管没有特别让人意外的惊喜,iPhone X 的全面OLED屏、面部识别Face ID技术仍是整个发布会的亮点。苹果iPhone X 可以说是追赶当下AI潮流的一款产品。
取代Touch ID的Face ID
根据苹果发布会上介绍,苹果的面部识别技术(以下简称: Face ID)有9大特征。
-
人脸验证
-
原深感镜头
-
注册简单
-
专门的神经网络
-
安全自然
-
用户隐私
-
注意力感知
-
自适应性
-
和Apple Pay以及其他应用协同工作
iPhone X 顶部被大家吐槽的“刘海"部分就集成了实现Face ID功能的这些器件,包括红外镜头、泛光感应元件、点阵投影器和普通摄像头。
很明显,仅仅拥有这些器件是不够的,还需要强大的处理器芯片。
手机前端器件在高达3万个采样点的基准上建立用户脸部3D数据后,之后的每次解锁都会将用户与之前采集的数据对比,传输到全新的A11芯片中的神经网络模块神经引擎(Neural Engine )进行处理。需要注意的是苹果云端并不会收集这些数据,安全性也因此大大提高。
值得一提的是在苹果发布会前一天,小米也推出了支持面部解锁的小米note3。同为“刷脸”,但背后的技术解决方案实则不同。小米note3上的“刷脸”技术提供商旷视科技告诉雷锋网:
苹果在过去的五年多时间,收购了五六家人脸识别公司,在脸部识别这一块有一定的技术积累。此次苹果iphone X上的采用的是红外结构光/结构光双摄,搭载3D结构光深度镜头,其原理是基于主动发射特定红外结构光照射被检测物体,从而获取人像的3D图像数据。
雷锋网了解到,结构光解锁方案安全性较高,相应的成本也较高。短时间内可能只会限制使用在像iPhone X这样的高溢价手机型号上。现在市面上出现的搭载人脸识别技术的手机多是应用2D人像解锁,因此也易被一些高仿真度的照片攻击。而结构光能抵御所有的平面攻击。
库克在发布会上也专门用数字强调了Face ID的安全性:
如果说原来的Touch ID有五万分之一的可能被破解,那么Face ID被别人打开的概率可能只有百万分之一。话句话说,安全性上升了20倍。
为AI而生——A11和A11 Bionic
早在几个月之前,网上就曾传闻苹果在做AI专用芯片,用于处理AI相关任务,比如面部识别、图像处理和语音识别。如今看来指的就是这款应用在iphone X上的定制芯片A11 Bionic。发布会上苹果全球营销高级副总裁 Phil Schiller 重点介绍了“目前最强大的智能手机芯片”——A11 Bionic。该 CPU 配备六核心,2个性能核心(Mistral)和四个效能(Monson)核心,分别比 A10 快 25% 和 70%。同时由苹果自研的 GPU 处理速度也比 A10 快 30%。A11人工智能芯片,专业的Metal2图形处理软件,结合深度整合的硬件,让Face ID这样的3D交互方式成为了现实。
A11 Bionic 除了对Face ID功能的支持外,它还有助于iPhone的AR功能实现,竖排摄像头专门为 AR 而校准,刷新率可达到 60 fps,全新陀螺仪和加速计,以及准确的动作追踪,这些都离不开A11提供的强大算力。
iPhone X 的发布为媒体之前的猜测画上了一个句号
最早之前,麻省理工科技评论记者采访库克时,提出了苹果在AI技术领域是否落后其竞争对手的质疑。
库克表示:
之所以媒体不经常对苹果的AI表示肯定和赞扬,是因为苹果只喜欢谈论那些即将上线的产品功能,而不像其他一些公司喜欢给用户“画饼”。苹果不会穿越去做2019、2020、2021才做的事情,并不是苹果不知道将要做什么,而是因为不想去谈论它。
同时库克举了具体已经应用到AI的例子,比如照片应用的图像识别,相册归类;Apple music的听歌推荐,通过对用户听歌记录的学习来调整作出相应的推荐。iPhone的电池续航,手机的电池管理系统使用了机器学习,了解用户的使用习惯并作出相应的调整,使续航更持久。
媒体想借此打探出苹果的AI研究进度,显然没成功。
而在今年的7月份,经历了长达几个月外界对苹果AI技术落后的质疑后,苹果主动对外展示了AI成果,首先是在7月20日上线了苹果机器学习官方博客(Apple Machine Learning Journal),并发表了第一篇博文;其次提交的论文被CVPR 2017收录,获最佳论文。在8月份,苹果又接着在博客上发表了三篇来自Siri团队的技术文章。
从苹果公开发表的论文研究不难看出,苹果AI仍然聚焦语音识别和图像识别领域。这也是目前最成熟的两个AI应用领域。此前苹果论文获CVPR 2017最佳论文讲的就是如何提高网络生成图片的真实性,用以假乱真的图片对模型训练,从而提高图像识别的准确度。Face ID中是否也应用了CVPR最佳论文中提到的训练方法及算法呢?以及还有哪些苹果尚未对外透漏的技术?
从这次发布的新款iPhone中来看,Siri的声音的确和真人相差不大,相比前几代有很明显的提升,不知是否也用到了苹果机器学习博客中提到的Siri相关技术?
雷锋网总结:从iPhone X的命名和读法上(读 iPhone 10)可以看出苹果的野心,要重建手机未来发展趋势(字母“X" 有未来之意),iPhone X的设计至少可以两年内不过时。苹果率先使用全面屏+3D脸部识别解锁组合方式,未来一定是其他手机厂商追逐的方向,就像当初iPhone 5s引领了指纹解锁潮流一样,iPhone X是否能引领下一个十年呢?
关于苹果AI方向的研究及动向,敬请关注雷锋网相关报道。
。