AiRiA研究院打造量化神经处理器,用全栈方案赋能行业
*本文来源于物联网智库,雷锋网 (公众号:雷锋网) 已获得授权。
导读
曾几何时,我们惊讶于AI算力和智力的创新程度,但彼时AI所创造的产业价值并不明显。随着移动互联网时代走向物联网时代,越来越多的场景和终端需要对数据进行即时高效的处理(如车联网、无人机、工业现场、物流、安防等场景),AI算力和智力从云端下沉到边缘,为物联网提供火眼金睛和灵敏大脑,成为AI和IoT一拍即合的“共识”。
在人工智能(AI)大热的这些年里,技术突破不断刷新着人们的认知,应用范畴也不断延伸到新的领域。尤其万物智联大趋势下,新场景、新需求、新机遇倏然出现,对AI提出更加多元、精准、高性能等新的要求。AI的能力与物联网(IoT)的需求结合越来越紧密,它们互为因果,共同加速着AIoT挖掘新的潜能。
那么,2019年对于AI玩家们来讲,有哪些不可错过的演进趋势、即将出现的重要突破和极具价值的应用方向呢?
AI下沉,从云到边
曾几何时,我们惊讶于AI算力和智力的创新程度,但彼时AI所创造的产业价值并不明显。随着移动互联网时代走向物联网时代,越来越多的场景和终端需要对数据进行即时高效的处理(如车联网、无人机、工业现场、物流、安防等场景),AI算力和智力从云端下沉到边缘,为物联网提供火眼金睛和灵敏大脑,成为AI和IoT一拍即合的“共识”。
这一趋势从两年前开始出现,边缘智能现已成为实现万物互联走向万物智联不可或缺的一环,也给如火如荼的AI芯片领域再添一把火。
聚焦场景,由“通”到“专”
同样是因为IoT场景的多样化,让AI从云端走向边缘/端侧的过程备受挑战。物联网时代,面对纷繁复杂、千差万别的数据和场景,如何满足其个性化需求、为其生产/生活/运营提供恰如其分的算力,通用芯片显得力不从心;而面向特定类场景、提供特定性能的AI芯片成为新的风向,得到许多AI创新者当下的青睐。
科技领域的创新往往是市场驱动着技术,AI也不例外,在IoT市场的驱动下,边缘智能和面向特定场景的AI芯片两大趋势已成业内主流。那么,从供给侧角度来讲,AI领域玩家又如何以技术创新来满足智联网时代无处不在的AI需求呢?如何选择有潜力的AI应用场景?边缘智能当前面临哪些困难?有哪些值得关注的技术进展?在近日的“普惠AI,芯向边缘”战略发布会上,中国科学院自动化研究所南京人工智能芯片创新研究院(AiRiA研究院)用成果展示了对这些问题的思考。
普惠AI,势在必行
长久以来,产业界、学术界和资本界从未放弃对AI价值的拷问,即,AI究竟能为哪些产业真正赋能,为其业务提升或模式革新带来多大助力,这是对AI市场价值的最好证明。
未来已来,AIoT时代图像信息将是未来数据洪流的主要呈现方式,因此AI加持下的图像处理将对相关行业产生巨大推动。事实上,安防、车联网、无人机、智能物流、工业视觉等场景近年来的规模爆发也正印证了这一点。中科院自动化所所长、AiRiA研究院院长徐波表示:以模型创新为源头,以芯片和系统为技术载体,与领域快速融合并呈现颠覆性应用的人工智能生态正在快速形成。从政策角度来看,人工智能连续三年被写入政府报告,并且总理在今年首次提出“智能+”,再次从国家战略的高度为AI产业注入新动力。
面对市场诉求和国家战略, 作为“人工智能国家队”的AiRiA研究院认为,AI要想脱虚向实,必须通过多行业的大规模落地来实现,换言之,如何克服技术和模式的重重困阻,让各行业用上AI,用好AI,才是AI落地与破局的当务之急。因此AiRiA研究院肩负起“普惠AI开拓者”的重任,以清晰的市场洞察和深厚的技术积累,一步一步向这个宏伟愿景迈进。
普惠AI的路上,有哪些难题困扰着业界?
普惠AI意味着为万物赋能,从云端到边缘的大势所趋也是AiRiA研究院作为AI芯片的后来入局者直接选择切入的方向。由于计算位置和形式的变化,让AI载体、设计思路都需要重新被定义。
云端的AI不受体积和功耗方面的束缚,可以在一定成本下做到极致的性能。然而在边缘端,AI载体(芯片)必须考虑终端场景的体积、功耗和成本实情(如机器人、可穿戴设备、无人机等场景中),如何在三者受限的情况下实现最高的AI性能,是考验芯片团队极具挑战性的难题。
AiRiA 研究院常务副院长程健博士表示,若以牺牲AI芯片的性能来满足IoT终端对体积、功耗和成本的要求,是一种“妥协”而非创新,如何在寻求平衡,做到较低功耗、较小体积和较低成本的情况下,还能保证性能不受到影响,才能真正满足诸多行业场景对边缘智能的综合诉求。那么,AiRiA研究院是如何应对这些严苛挑战,达成AI芯片领域重大突破的呢?这就要提到中科院自动化研究所基于十几年对量化处理技术的深厚积累了。
量化处理技术是如何帮助AI芯片在成本、功耗、性能等综合方面发挥优势的?
量化模型压缩处理技术可以极大简化整个计算过程。AiRiA 研究院副院长冷聪博士进一步介绍道,量化技术的精细化程度越高,对整个计算过程简化和整合的效率就越高。目前业内采用量化处理技术的标配是支持8比特,但AiRiA 研究院能做到4比特、2比特甚至任意1比特的量化,在国际上也达到了领先水平。
随着量化程度的提高,AiRiA研究院自主设计的量化神经处理器QNPU(Quantized Neural Processing Unit)可通过大规模神经网络实现片上计算,从而减少或无需访问外部存储,这就解决掉耗费极大功耗、带宽和体积成本的“内存墙”难题。这样一来,就满足了多种IoT的边缘计算场景的应用,在小规模的、小体积、小功耗的前提下仍保证高可靠的计算性能,这是QNPU非常突出的特性和优势。
在如火如荼的AI大潮中,如何以科研人的态度做“严肃的人工智能芯片”?
近年来随着全球科技革命的升级,芯片产业一直被寄予厚望,尤其在竞争激烈的AI领域,巨头与新创企业不断以更新更强的AI成果冲击着人们的眼球。然而更值得思考的是,我们究竟需要什么样的AI技术和产品、方案和应用?如何将技术成果实现普惠?
AiRiA研究院首席科学家张旸博士认为, AI和科研一样需要求真务实,脱虚向实,因此以科研人的态度、稳健的节奏来做“严肃的人工智能芯片”,是AiRiA研究院在技术优势之外更加独特的高度,他带领芯片团队开发的 AiRiA研究院第一款QNPU芯片Watt A1即将正式问世,预计在下半年9月份、10月份流片,采用台积电28nm工艺,峰值算力达24Tops,支持1080P四路视频实时检测,MobileNet图像分类达每秒8000帧。目前在WattA1的demo展示中,基于QNPU的自动驾驶、人脸识别等高性能应用场景都得到充分体现。
全栈方案,赋能行业
在赋能行业、加速落地的路上,AiRiA研究院以行业需求为导向,为企业用户构建软硬一体的AI解决方案。除了QNPU之外,AiRiA研究院还推出了模型压缩工具QTrainer和深度学习推理引擎QEngine。QTrainer不仅支持QNPU,还支持第三方开发自定义应用。QEngine也是针对量化架构,兼容多种处理器和硬件,它们共同将软件、硬件、算法协同优化,构建全栈的AI解决方案。
目前,AiRiA研究院已与多个行业的领先企业达成合作,以上游技术的定位与下游各行业的集成商广结生态,包括智慧安防、智慧零售、自动驾驶、智慧物流等领域,共同推动AI在不同行业的渗透。在“普惠AI,芯向边缘”战略发布会上,AiRiA研究院与赛格导航、高新兴物联达成战略合作,三方合作推出“基于低成本芯片的自动驾驶算法软加速”方案。该方案基于QEngine引擎,结合高新兴物联的智能通信模组,为赛格导航的ADAS高级驾驶辅助系统提供了高性能、高可靠的落地支撑,实现主动安全、车队管理、驾驶行为分析等多种场景应用的生态绽放。
仰望星空,放眼未来
AI的发展潜力和行业潜力还有更多可能性值得探索,普惠AI之路任重而道远。比如,AI芯片性能的进一步突破,真正的AI芯片应该是具备自学性的能力,朝着无监督、自主进化方向。
未来,AiRiA研究院将立足边缘端推理专用处理器,向着自主进化芯片领域迈进,为更广阔的应用场景赋予智能,为国之重器芯片产业的发展增添助力。
物联网智库“2019-2020中国物联网产业全景图谱”
雷锋网版权文章,未经授权禁止转载。详情见。