华为在麒麟970押注人工智能的背后:除了芯片,还有数据、生态与云
华为将在IFA2017大展的新品发布会上,正式发布了麒麟970芯片。麒麟970的规格终于水落石出,与此前的推测相差无几,
麒麟970中内置了神经元网络单元(NPU)
,而根据业内人士透露,这块人工智能芯片确实就是来自于寒武纪科技IP的寒武纪-1A。而这块寒武纪-1A的性能,据华为自身透露其运算能力达到了1.92TFP16 OPS,相比4个Cortex-A73核心,处理同样的人工智能任务大约会有50倍能效和25倍性能的优势。
这里需要指出的是, 所谓的处理人工智能任务准确地说是深度神经网络计算加速 ,如矩阵运算、计算激活函数等任务,这颗NPU实质是一款深度神经网络加速器,用于将训练好的深度神经网络模型进行设备端(On Device)的快速推断。毕竟目前几乎所有的AI应用都用到了深度神经网络技术,NPU的引入有助于解决传统手机芯片架构难以提供足够算力去实现深度神经网络的本地端计算,使得AI应用不再依赖于云端计算。
作为全球首颗内置AI芯片的SoC,麒麟970无疑寄托了华为在消费端人工智能演进的憧憬,以至于抢跑在其他SoC商之前实现深度神经网络加速芯片的商用化, 并通过做第一个吃螃蟹的人获得了红利期 ——尽管目前高通和三星均有意发展深度神经网络加速芯片,但距离华为还将有至少一代SoC的距离。
在华为正式发布麒麟970后,随之市场上出现了不少质疑其NPU实际价值的声音。单纯从芯片本身,我们难以理解为何华为在消费级人工智能应用尚未大规模爆发之前,就急于推出商用化的芯片产品,或者我们需要从华为在后续消费市场布局的角度切入,才能了解其中的蛛丝马迹。
NPU成功的评价标准
麒麟970上NPU成功的核心评价标准, 是卖出手机中这颗NPU的实际利用率 。这点决定了华为是否能借助NPU逐渐构筑起消费端的人工智能应用生态,让拿到Mate 10等采用970芯片手机的消费者能使用起这颗NPU的性能并形成一定粘性。也就是说,这颗NPU及基于NPU加速的人工智能应用,必须能占据一定的国民总消费时间, 否则就仅仅如同当年三星S4的眼球追踪、索尼悬浮触控等技浪漫主义产物,最终消失于消费者视线。
另外,我们不能忽略以下两个背景材料:
一是华为与微信的用户数据使用争执 。起因是华为搭载了Magic Live 智慧系统的荣耀 Magic 手机,华为通过这款手机获得用户授权后收集用户数据,其中包括微信的聊天信息等。而其用途是根据微信聊天内容,自动加载地址、天气、时间等信息,通过对用户数据的分析,手机能感知的用户的习惯性偏好并提醒相应的事项,如回家路况等。腾讯认为华为此举侵犯了自身的数据,侵犯了微信用户隐私,并向监管部门投诉华为,而华为则认为产品通过检测,并获取了用户的充分授权,并不存在争议。
二是华为今年发力公有云业务,成立云BU并发布企业智能(EI) 。对于要成为 “全球五朵云之一”的华为云,华为对其定位是智能社会的“使能者”,聚合人工智能、物联网等基础能力,提供创新的企业智能云服务。而华为云其中的核心是企业智能(EI)平台,EI包括了机器学习、深度学习、图计算,及AI训练、推理、检索等基础平台服务,同时搭载类似阿里云市场的视觉、语音、自然语言等领域API服务及场景解决方案,并具备完整的异构计算平台。
对于手机业务已经做到了出货量全球排名第三、中国排名第一的华为,也面临了与其他手机厂商一样、对于智能终端领域下半场的思考。 目前手机厂商有点类似前几年电信运营商所面临的“管道化”困境, 即3G/4G网络虽然催生了移动互联网应用的发展,但作为网络基础设施的运营者,电信运营商只赚取到了网络管道的收入,却享受不到留在管道之中的移动互联网流量红利。于是电信运营商纷纷提出了“ 智能管道 ”战略,简单而言,就是利用运营商所掌握的用户行为大数据,做业务和内容的智能分发,从而希望在移动互联网红利中分到一杯羹。
对于手机厂商而言,硬件毛利在激烈的竞争中不断降低,而硬件配置升级的市场驱动能力似乎也在不断地减弱,智能手机的模式逐渐走入了瓶颈,而手机终端本身的内容分发能力,随着BAT对流量的牢牢控盘,其天花板也在不断下坠,可以说目前是手机厂商思变的时候了。 在众多手机厂商中,除了苹果,安卓阵型普遍缺乏以硬件驱动应用生态的能力 ,而麒麟970及搭载的NPU,瞄准的是在消费端人工智能应用逐渐爆发之际,通过深耕硬件端到端的异构计算服务,建立硬件对人工智能应用生态的驱动力。
NPU背后的布局
面对智能手机的下半场思考,华为希望演进出新的智能手机范式:一方面在 人机交互上前进一大步 ,手机终端不再仅仅被动接受用户的操作,而是通过持续收集用户使用数据,对用户的使用意图充分场景化,手机终端通过场景智能提供主动反馈的服务,如用户到达电影院后,根据定位主动弹出电影票的取票码;另外一方面 具有很强的本地(On Device)计算能力 ,以适应各种智能场景下复杂的计算密集型人工智能任务,比如运行实时的高精度人脸识别算法,实现手机短信仅本人可见,或者本人注视手机屏幕自动亮屏。另外由于用户隐私数据保护问题,所有用户行为数据并不能上传云端,意味着如果要做复杂的用户行为数据推断,也需要借助On Device的计算能力。
这样,华为围绕麒麟970及其NPU的布局路径就清晰了:
第一步: 探索受限于用户隐私保护边界的 手机本地端用户数据收集——应用机制 ,这方面华为在荣耀Magic上已经做了充分尝试,这点类似于电信运营商的管道监听能力,用户数据构成了一切智能应用的基石。
第二步: 充分利用麒麟970上NPU的先发红利期。通过NPU赋予的深度神经网络加速能力,为970系手机终端汇聚一批“一拍即合”的人工智能应用,比如各类需要借助深度神经网络的复杂图片处理APP、实时翻译、智能语音助手等NLP应用,使得这些应用在NPU的加持下能有较好的用户体验 ,从而深化手机终端智能场景服务的广度和深度,并形成围绕终端硬件的应用生态雏形,这一步非常关键 。
第三步: 华为云服务上场。定位于智能社会 “使能者”的华为云,必然将和自家手机终端产品开展深入联动,基于华为云的异构计算基础设施,在目前华为开发者联盟已聚集超过27万开发者的基础上,吸引消费端AI应用开发者到达华为云,使用华为云的异构计算能力开发、部署AI应用。
我们知道,基于深度学习的AI应用开发及消费级市场服务提供, 需要用到大量由GPU/FPGA/AISC等芯片提供的异构计算能力 。尤其是在深度神经网络应用的推断阶段(Inference,即指利用训练好的模型,使用新的数据去“推断”出各种结论),仍然也是计算密集型任务,因此需要采取设备端推断+云端推断的模式优化消费者端体验,例如中小运算量的应用放在设备端,兼顾体验减少云端压力,大型计算仍然采用云端推断。 因此,如果华为能为AI开发者提供端到端的Inference异构计算能力,即970系终端上的NPU,加上华为云的异构计算,无疑对于AI开发者来说是具有不少吸引力的。
最后基于上述 “数据+终端+云+芯片” 的布局,以点成线带动形成一个相对紧密的AI应用生态,逐渐进入良性循环并让搭载麒麟970及其后续型号芯片的华为手机终端系列能授予用户较为良好的AI应用体验。
面临的挑战
华为 “数据+终端+云+芯片” 协同的打法,符合华为世界第一大通信设备商的资源禀赋,也顺应了自身的华为云战略布局,放眼国内恐怕也只有华为一家能做,但是否真的能凑效?谈这个问题恐怕目前还为时尚早,但可以预见的是,华为将会面临一些核心的问题:
首先,是华为这种手机本地端的用户数据收集——应用机制将会受到来自于用户及业界越来越多的挑战。 腾讯首先对此发难并将此上升到仲裁层面,而腾讯也绝不会是最后一个,随着华为将数据收集的范围扩大到越来越多的应用上,甚至以用户隐私数据安全的名义充当起裁判的时候,无疑将让华为陷入硝烟四起的漩涡之中。华为该如何在用户隐私数据保护、友商及业界关系中取得平衡?这点也许是一个很大的考验。
其次,是华为是否能够迅速找到能有效利用起NPU计算能力的杀手级应用。 在营销层面,华为或许有1000种手段去宣扬搭载了麒麟970手机产品在人工智能时代的颠覆,但真正的评价标准,是卖出手机中这颗NPU的实际利用率。而实际利用率离不开的,是亟待深度神经网络加速计算能力的Killer Apps,但至少目前短期内似乎还没能清晰看到这样的应用存在。
三是华为端到端(云-芯)的Inference异构计算能力是否能吸引到足够的AI应用开发者加入到生态中。 正如亚马逊智能音箱Echo推出开始时应用(Alexa的Skill)的数量惨不忍睹,随后当Echo出货量爆炸式增长后,亚马逊吸引了大量开发者融入Alexa生态中,目前Alexa已经有了一万多个Skill。而其中的关键驱动力,是亚马逊强大的云计算能力——通过AVS(Amazon Voice System)以及ASK(Amazon Skills Kit)的开放,搭建了一个开发门槛低得不能再低的生态,开发者甚至完全不需要有任何语音识别的技术积累,AVS会解决所有的语音识别和语义处理等事情。 亚马逊Echo的启示是,对于任何希望通过硬件驱动生态的战略,除去出货量代表的开发前景外,最为关键的驱动力,是为开发者提供一套低门槛、便利的开发环境,对于刚刚起步的华为云,这点是否又能做到?
作为独立观察者,我们不妨通过三条线索观察华为“数据+终端+云+芯片”协同的后续走势: 第一是华为终端上用户数据的争夺战;其次是能否有足够的Killer Apps去有效利用起NPU的深度神经网络加速能力;第三是上述AI生态的构筑 。这三条线构成了整体平面,任意一条线的失利都会让华为的布局变得支离破碎。
上述的布局,显然不是在麒麟970这一代SoC的周期内就能充分实施的。或者我们看到的这次麒麟970搭载NPU尝试, 对于华为而言更多的价值,是利用先发红利去探索端到端异构计算如何驱动AI应用生态。
也许,这是一次机遇足够大,但挑战同样足够多的尝试。
雷锋网版权文章,未经授权禁止转载。详情见。