研发神经网络处理器NPU及解决方案,Kneron要做人工智能时代的NVIDIA
过去这些年,伴随着 3D 技术兴起,专用于 3D 图形运算加速的 GPU 崛起,并诞生了 NVIDIA 和 ATI (现 AMD) 两大巨头。近几年人工智能兴起,对高效运行神经网络算法的处理器需求日益增加。为此 Google 研发了专用于深度学习的 TPU,中星微发布了国内首款 NPU “星光智能一号”等。来自美国的 Kneron,也希望用针对神经网络计算加速的处理器 NPU,成为人工智能时代的 NVIDIA。
关于 NPU(Neural Processing Unit),目前还没有准确定义,通常是指专门针对神经网络的计算进行加速的处理器,可以低功耗高效能地处理并行运算。3D 时代诞生了 GPU 针对通用 3D 做加速,AI 时代或许也需要针对神经网络加速的 NPU。目前的 GPU 也具备高效并行计算能力,但 NPU 在神经网络计算方面的性能和功耗又要优于 GPU。
通过提供 NPU 及配套的软件解决方案,Kneron 给自己定位的是未来的 Google+NVIDIA。Kneron 的 NPU 支持运行各种神经网络,如 Caffe、TensorFlow 等。处理器本身体积很小,小到可以嵌入手机,但创始人刘峻诚博士告诉 36 氪,Kneron 的处理器性能很强。以运行目标识别算法为例,Kneron 的 NPU 性能是英特尔 Xeon E5 CPU 的 8 倍、英伟达 M40 GPU 的 2 倍左右,而功耗,分别是两者的 1/1000 和 1/2000 左右。
除了芯片,Kneron 自己也做智能算法的研究,可以把面向特定功能、训练好的神经网络模型写入芯片提供给客户。Kneron 还可以提供服务器端的 NPU,并组建云 + 端协同的整套 NPU 解决方案。刘峻诚博士介绍,Kneron 已经签订了一些大客户包括:国内著名互联网巨头、台湾著名代工厂、国内著名手机和通信系统供应商、国内顶尖大学旗下芯片公司等。
要研发 NPU,显然需要团队此前有相当的积累。Kneron 创始人刘峻诚是 UC Berkeley、UC LA 和 UC SD 博士,曾参与 NASA JPT、IARPA、Bell Labs 的研发项目,也曾在三星研发中心和高通任职。联合创始人还包括 Intel 圣地亚哥蓝牙部分前负责人、中兴手机前 VP、甲骨文前副董事总经理与技术总监。团队其它成员毕业于 MIT、Cornell、Purdue、清华、台湾大学等,曾在 Google、微软、Broadcom、Bell Labs、IBM 等机构任职。
Kneron 刚刚成立半年,团队目前人数不到 20 人,此前曾获得数百位美元的天使轮投资。虽然 NPU 属于技术门槛相当高的领域,但毕竟 Google、高通、NVIDIA、IBM 等都在朝这一领域加大投入,时间对于 Kneron 显得十分重要。