安防行业为何缺少真正适用的AI芯片?
制约AI安防芯片规模化应用的核心技术问题是什么?
这是不少芯片企业面对安防场景时,不断向自己提出的疑问。在提高AI安防芯片性能,加强算力的同时,从业者们也逐渐发现,芯片中最为关键的其实并不是单纯提升算力,如果不进行存储优化,那么芯片实际提供的计算力会大大降低。
“要突破AI芯片的瓶颈,并不能只是简单的增加计算算力,而是一定要把数据存储管理做好。”探境科技创始人兼CEO鲁勇说道。而对于存储问题的解决,仍是一个探索中的新方向。
阻碍AI芯片的内存墙问题
AI芯片对于传统芯片带来的挑战,并不只是计算架构上的,更多是在存储架构间的。
传统的芯片采用的是冯·诺依曼架构,其核心架构中计算模块和存储单元是分离的。CPU和内存条并不集成在一起,只在CPU中设置了容量极小的高速缓存。
也就是说,CPU在执行命令时必须先从存储单元中读取数据。每一项任务,如果有十个步骤,那么CPU会依次进行十次读取,执行,再读取,再执行……这就造成了延时,以及大量功耗花费在数据读取上。
这一问题也被称为传统芯片的“内存墙”问题。
而在AI 应用中,冯·诺伊曼“瓶颈”问题显得愈发严重。AI依赖的算法是一个庞大和复杂的网络,有很多参数要存储,也需要完成大量的计算,这些计算中又会产生大量数据。在完成大量计算的过程中,一般芯片的设计思路是大量增加并行的运算单元,例如上千个卷积单元,需要调用的存储资源也在增大。
不夸张地说,AI初创芯片公司虽然采用不同的路径打造芯片,但事实上都在努力对这一问题予以解决。大部分针对 AI,尤其是加速神经网络处理而提出的硬件架构创新,都是在与这个问题做斗争。
而成立于2017年的AI芯片初创公司探境科技,也在这一路途上跋涉。不过不同的是,探境科技选择另辟蹊径,直接从存储子系统的优化入手,解决“内存墙”问题。
自研存储优先的SFA架构
而如何解决这一问题呢?
目前解决这一问题的方法有几种,较为常见的方法是加大存储带宽,采用高带宽的外部存储,以及从算法入手,设计低比特权重的神经网络。
除此之外,存算一体化也被看做是未来的发展方向,在实现上也分为不同的路径。
其一是SSD中植入计算芯片或者逻辑计算单元,可以被叫做存内处理或者近数据计算,这其实是深度学习的一种应用场景,并非是AI芯片架构的创新。
另一种就是存储和计算完全结合在一起,使用存储的器件单元直接完成计算,比较适合神经网络推理类应用。
而探境科技则另辟蹊径,提出了完全不同的解决方案。
鲁勇提到,并不认同目前存算一体的处理方式,主要原因是成本太高,并不符合市场需求。
“存算一体的处理方式,其实违反了芯片中的成本结构。芯片中,之所以设计和区分片上的缓存SRAM,及片外的DRAM,就是因为如果所有存储都放入芯片内部,成本就大幅上升,会上升几十倍到上百倍。”
因而,抛开将存储全部放入芯片内部的方式,探境科技自创了SFA(Storage First Architecture,简称SFA),即存储优先架构。
不同于常见的解决内存瓶颈的方法,SFA是“以存储调度为核心”的计算架构,数据在存储之间的搬移过程之中就完成了计算,计算对于数据来说只是一种演变。
“与通常计算的先有计算指令然后提供数据相反,SFA架构,存储是我们优先的出发点。考虑数据在搬移过程中做计算,也就是由数据带动计算而非由算子带动数据。”鲁勇进一步解释。
这一点与AI大神Lecun所宣称的所有的神经网络都是图计算问题不谋而合。
那么打破传统冯·诺依曼架构,自研存算一体架构的依据是什么?
这可以谈到人类大脑的存储和计算方式。从生物角度讲,大脑存储大量的知识,能够快速提取并访问,而大脑的内存和计算并不是分开的,更多的是存在一定的相容性。因而,未来的计算机可能不是基于计算的memory,而是基于memory的计算,更多做到融合。
不过,因为当前芯片领域对于AI算法的关注还较多,针对AI的结构改进尝试还偏少。未来,memory与computing结合的尝试,会更可期。
鲁勇也介绍道,目前专注于从存储子系统入手,着力解决AI芯片的存储计算架构问题的企业并不多,而其中很多公司从事的都是成本结构并不合理的存算一体架构,符合合理的成本结构并优化存储子系统的公司更是屈指可数。
安防还未有一款真正适用的AI芯片
安防作为计算机视觉较快落地的领域,也成为探境科技较为看好的场景之一。
探境科技的创始人兼CEO鲁勇,出身全球十大芯片厂商之一的Marvell半导体,是位在半导体业摸爬滚打了15年的老兵。
在成立探境科技之前,鲁勇曾是Marvell半导体的中国芯片研发总监。据鲁勇介绍,在Marvell这十年里,他从零开始,一手搭建了Marvell的中国芯片研发团队。
探境科技创始人&CEO 鲁勇
在创立探境科技之前,几位在海康威视、大华股份等安防巨头中任职的朋友都陆续来找到鲁勇,咨询英特尔Movidius VPU是否能够适用于终端AI处理的需求。
鲁勇认为,目前市场上还没有足够优秀的适合安防前端的通用芯片,也没有一款很适用安防的AI芯片出现。不过Movidius的火爆,恰好说明了市场对边缘端芯片的强大需求。
于是,2017年,鲁勇决定离开Marvell,与一群老朋友成立了探境科技。
在安防领域里面,有大量的算法需要前置。目前的算法基本都是基于深度学习。
而探境科技的芯片,如何更好适用于安防大量非结构化数据的处理需求呢?
鲁勇讲到,安防领域的数据特点,主要在于需要实时的处理大量连续的图像数据流。“安防领域的数据处理,在于两个维度。第一是每秒处理帧率要越来越高,第二是图像分辨率上要高。在这两个维度上,安防对边缘芯片提出了要求。”而探境科技的优势则在于,基于SFA架构,能更好优化存储和计算,从而更好解决这一问题。
安防领域,边缘端的芯片,已有不少厂家入场。其中大厂有之,明星初创公司亦有之。
目前来看,边缘终端市场有两种形态的芯片产品,一种是针对特定应用的SoC,一种是通用加速器做独立芯片。
如在安防领域,SoC面向专用市场,在芯片中深度学习加速计算事实上只是一部分,而其他大部分芯片面积则交给了主控处理器、视频解码等模块。
终端通用深度学习加速器芯片市场的应用则刚起步。许多公司的市场布局主要一是培养开发者生态,另一方面也探索研究哪一领域最有潜力,针对几个重要的场景推出相应的优化芯片。而探境科技的目标就是做支持所有神经网络的通用型AI处理器。不仅在安防领域,也瞄准了其他应用场景。
鲁勇认为,探境科技基于SFA架构的AI芯片,在优化了存储架构的同时,能够适用于智能家居、智能安防、智能穿戴、智能车载、智能外设等更多场景,低功耗低效能的解决更多问题。
目前,探境已量产了应用这一架构的语音识别芯片音旋风611,视觉芯片今年下半年也将发布。
AI芯片,登高需防跌重
但实际上,近两年,许多AI企业的芯片纷纷宣布流片,尤其针对安防领域的芯片并不少,但似乎还并未出现强势的对传统芯片的替代或继任者。而作为一个芯片界的老兵,如何看待AI芯片行业的发展呢?
鲁勇认为,AI芯片确实是被公认的一个国内企业弯道超车的机会。相较于国外更看重云端场景,国内有在边缘端有大量市场,这为国内AI企业在边缘芯片的发展提供了良好的机会。
但国内虽有很多公司关注对AI芯片的底层架构的研发,也有不少AI芯片公司“只追求有,不追求好”,用拼凑的方式来做芯片。很多公司为了顺应市场形势,将自己包装为一个AI芯片公司。这样就给市场造成了很大泡沫。并且,国内AI芯片企业,也普遍缺乏后端设计的人才。
后端设计相对于前端的逻辑设计,更多涉及到芯片的工艺,也相对更需要丰富的经验。国内在后端设计人才上更为紧缺。因而,很多厂商会通过外包的方式做后端服务,来完成生产。这对芯片厂商来说,其实是一个很大的竞争劣势。
AI芯片,“登高”似乎也面临着“跌重”的风险。
不过,大浪淘沙。在2017年就看到,并率领团队致力于解决AI芯片中的存储问题,鲁勇显然对自己和探境科技都更有信心。
“芯片,作为一个赢者通吃的行业,对技术和产品的能力要求都非常高。行业最终会看到,技术和产品会主导AI芯片的格局。具备两者实力的AI芯片公司,会最后存活下来。”鲁勇说道。 雷锋网雷锋网雷锋网 (公众号:雷锋网)
。