坚决不碰自动驾驶和云,耐能的可重组架构AI芯片能在AIoT市场取胜?
AI芯片领域最近几年迎来了许多新玩家,大部分初创公司都进入了终端AI芯片市场。在中国,自动驾驶和安防应用是最热门的AI创业方向。2015年在美国成立的耐能表示不碰自动驾驶和云端AI芯片市场,还在近日推出了物联网专用AI SoC——KL520,从创业开始就非常看重盈利能力的耐能真的能赢得AIoT市场?可重组架构有何特色?
24小时不间断开发的创业团队
耐能创始人兼CEO刘峻诚创业前任职于高通的多媒体研发部门,也是因为在高通的工作经历促使了他选择创业。“其实高通早在2011年左右内部就在尝试做终端AI的方向,我也参与其中,不过当时还看不太清楚具体的应用,因此当时在高通很难得到重视。我非常看好AI和NPU的潜力,最终决定离职创业,在2015年3月在圣地亚哥创立了耐能。”刘峻诚接受雷锋网 (公众号:雷锋网) 专访时表示。
耐能创始人兼CEO刘峻诚
有意思的是,刘峻诚是和一群比他资深的专家创业。耐能COO是Milkyway Sillcon Technology前COO刘彦甫博士,CCO是高通前开发副总裁Adrian Ong,首席科学家是高通前多媒体研发总监李湘村,首席架构师是金蝶中间件前首席架构师袁红岗,技术总监是曾长期任职于贝尔实验室、三星研发部门的陈云刚。
刘峻诚是靠什么魅力吸引到多位资深专家的?刘峻诚表示:“我觉得能吸引到这么多比我厉害的人加入耐能,最主要的是因为我们真的在做事情。”另外,据Adrian Ong的说法,因为耐能美国的办公室就在高通的旁边,加上双方也有一些合作,他留意到在感恩节、圣诞节这样美国的假期,耐能的办公室晚上十一二点都是灯火通明,这让他想起了刚加入高通时大家为一件事情一起打拼的感觉,最终选择辞职加入耐能。
刘峻诚还特别介绍了耐能跨越的三个障碍让他们有了另外三个特点。 第一个特点是耐能在美国圣地亚哥、台北、新竹、深圳、珠海两大洲五地都有办公司,美国的休息时间亚洲能够继续开发,亚洲的休息时间美国又可以继续开发,因此他们可以进行24小时不间断开发。 另外一个特点就是由于团队成员的年龄差别非常大,有时候想法不太一样,这样就需要跨越年龄的障碍,吵过架之后继续携手向前走。最后一个特点就是同时研发软件和硬件带来的技术障碍。
从单纯卖IP到提供SoC的商业模式改变
虽然如今耐能已经能够提供从IP、芯片到SoC的硬件产品及配套软件,不过耐能切入AI市场的产品是自主研发的IP。IP在芯片行业相对而言是投资和风险都相对小的生意,对于AI芯片公司而言,自研IP能够实现更加个性化的产品,满足市场差异化的需求。
但并非所有AI芯片公司都拥有自研IP,这主要是因为不同公司的研发能力、商业模式以及技术的特点不同,所以可以看到完全自主研发IP、自主研发IP+使用第三方IP等方法。据介绍,耐能的IP属于完全自主研发,由于聚集了大量专家,他们花了大概一年半的时间就推出了第一代IP,推出之后还在保持迭代。
去年9月,耐能发布了第二代IP,包括低功耗版KDP 320、标准版KDP 520、高效能版KDP 720。2019年的CES上,耐能展示了最新的3D AI解决方案,并宣布将会在第二季度推出智能物联网AI SoC。
对于商业模式的改变, 刘峻诚表示:“以IP的方式进入市场,是因为敬畏市场,而且我们公司的特点也是踏实做事。公司的目标都是尽快盈利,我们确实也在2017年通过销售IP产生了营收。提供IP的风险确实比提供芯片小一些,因为不用投入大量的资金进行流片,但是毛利也低一些,同时由于不直接和芯片用户对接,也会失去一些市场信息。其实从很早我们就想提供芯片,但是基于风险以及资金比较少的考虑,因此选择先提供IP,当看到我们的IP变为产品,也了解一定的市场信息之后,才推出芯片。”
“我们的IP和芯片都获得了市场不错的反馈,但我认为一整套的方案才比较有竞争力。基于我们软硬件一体的实力,我们最终在今年推出了SoC,这也会成为未来公司营收的主要来源。”刘峻诚进一步表示。
据雷锋网了解,目前耐能已经与Cadence和Synopsys全球两大IP提供商合作一起向第三方提供AI IP。那最新推出的SoC竞争力如何?
可重组架构芯片有何不同?
耐能最新推出的KL 520 SoC采用40nm工艺,神经网络处理器算力最高可达345GOPS (300MHz) ,平均功耗500mW,并且搭配Arm Cortex-M4,既可以分担主芯片的AI算力作为协处理器,对于轻量级的应用,也可以直接替代主控芯片。 刘峻诚强调,AI芯片不能只看算力,成功的终端AI芯片应该同时具备算力、成本、功耗和兼容性的优势。
最让刘峻诚感到自豪的就是KL520极高的MAC利用率, 据他介绍, KL 520针对ResNet50和GoogleNet的MAC利用率达到73%和74%,相比其它的AI芯片有3.15倍和1.71倍的提升。
另外,这款AI芯片能够支持ONNX、Tensorflow、Keras、Caffe框架,采用Vgg16、Resnet、GoogleNet、YOLO等主流的CNN模型,在其独特的压缩技术下,压缩精度的损失<0.5%。
那么,兼容主流框架和第三方算法带来的复杂性是否会增加芯片的功耗?刘峻诚表示:“如果是传统的架构,同时支持多种AI模型确实会带来功耗的提升,但是我们的有非常独特的可重组架构。”
所谓的可重组架构,可以理解为这款芯片提供的是一堆乐高积木,当需要支持语音AI的模型时就通过指令集进行组合,需要支持图像AI模型时,再重新组合,可以很好地支持多种神经网络模型,并且保持架构的精简性。 由此也就同时带来了性能和功耗的优势,更进一步,可以在与级别产品性能相同的情况下,选用更加成熟的工艺制程,降低成本,最终实现高性能、低成本、低功耗、高兼容性的优势。
更深一层, 可重组架构的优势更本质的是解决了存储的问题,提升MAC的利用率。刘峻诚透露,他们的巧思是实现了动态存储DMA(Dynamic Memory Assessment),当处理器对存储没有很高的需求时,就预先准备好,当需要使用的时候就直接读取,实现效率的提升。
不仅如此,可重组架构还能动态支持同一个神经网络的不同数据精度需求。最终的产品可以根据客户的需求,可以支持Int8、FP16以及更高的精度。另外,压缩率也能够控制在0.5%以内则是来源于耐能独特的开放平台,通过这个开放平台能够将压缩率提升40甚至50倍,压缩率损失则小于0.5%,这是软件或者说软硬一体优势的体现。
耐能称为可重组的架构研究已经在国际知名的半导体期刊上发布,并且在美国、台湾都拿到了专利。据悉,如果想要设计AI芯片,有时候不太容易避开这些专利。
对于可重组架构与北京清微智能的可重构架构有何不同,如果继续用乐高的类比来解释,耐能的架构是积木层级的可重组,清微智能的可重构则是面粉层级的可重组,更加底层。
能否抢占AIoT市场?
既然可重组架构的芯片可以满足从语音到视觉不同应用领域的需求,为何耐能更看好AIoT市场? 刘峻诚表示,耐能坚决不碰自动驾驶市场,因为有车规的要求,想要进入车厂一般有四到五年的周期,这么长的周期不太适合初创公司。 安防行业想要通过芯片直接和海思、海康威视或大华竞争也不太现实,在安防行业我们会选择以合作的方式。我们选择AIoT市场,是因为看到了家电厂商使用我们IP的芯片已经量产,并且也确实看到了这个市场的需求。
“ 更具体地说,智能物联网市场,包括扫地机器人、智能门锁、智能家电等市场对于低成本低功耗高性能的AI芯片的需求,最终才慎重的推出智能物联网专用的AI SoC。 “他进一步表示。
但是,为什么会选择中端的IP率先推出SoC?刘峻诚表示,我们推出一款产品不希望是赔钱,低端的我们已经推出的是模组,也有了合作伙伴,比如奇景光电。高端的比较担心市场的需求,因此推出SoC会更加谨慎。
耐能还有一个坚决不碰的就是云端芯片。刘峻诚表示云端最终比拼的是生态,很难与已经具备生态优势的巨头竞争。虽然终端市场的需求复杂多变,错估一个产品就可能打垮公司,但同时这种每年变化带来的营收增长的机会,耐能的团队习惯了这种节奏,也能打硬仗。
不过,一款芯片即便性能再高,没有出货量最终也会归于失败。发布会上,大唐半导体研发部技术总监母大学表达了在智能门锁产业安全问题日益明显的当下对新款SoC的信心。奥比中光高级战略BD总监彭勋禄也表达了对与耐能合作推动AI 3D行业发展的期待。
除此之外,格力、搜狗、钰创科技、全科科技等公司都采用了耐能的IP或芯片。不过刘峻诚指出,还有更多的客户出于不同的原因,包括手机领域、家电领域的厂商的客户都不能公开,我们的产品需求比我们人力能支持的更多。
更值得一提的是, 耐能有一个更高的愿景,这也是他们希望能够区别于其他终端AI芯片公司的特色——Edge AI Net,具备去中心化、多模输入、离线本地处理、主动智能、算力共享的特点。
刘峻诚举例表示,基于可重组芯片可以构建一个边缘的特别的网络,这个网络的规则可以是使用者制定,比如在家庭中构建一个AI智能网,指定的规则是如果小孩靠近危险的物品,就做出相应的反馈,如果小孩靠近厨房,电饭煲就会断电、燃气灶不能打开,等等,这些都需要基于语音或视觉的可重组芯片,还能进行算力共享。
雷锋网小结
采访刘峻诚的过程中,能够很明显的感受到他把公司踏实做事以及产生营收摆在了最重要的位置。从IP到SoC商业模式的变化,再到专用芯片推向市场,这种变化背后最重要的考量都是营收。同时,刘峻诚表示坚决不进入自动驾驶市场,反而选择需求非常多样的智能物联网市场,原因除了可重组架构的带来的技术优势,还因为看到了市场的需求。坚决不碰云端芯片市场是作为一家初创公司避开与巨头正面竞争的考量。
通过了解耐能的发展,也能够感受到这家聚集了多位前高通员工以及技术背景高管的初创公司的风格是很明显的美国公司风格,成立四年多,一直保持低调,即便在2017年就产生了营收也并未过多渲染,而是直到有一些可以公开的成功案例,才选择用实际的案例证明自己的实力,这并非是大部分初创公司会选择的方式。
关于融资,刘峻诚在采访中透露了他们今年会有一个比较大的规划,目前还不能更进一步地探讨。
耐能是一家团队文化比较独特的公司,不过更值得关注的是其可重组架构的技术特色,技术架构的优势能够最终转化为产品的优势。想要达到商业上最终的成功,有客户购买产品产生营收是关键,我们已经看到了耐能的部分可公开用户,这是迈向成功的关键一步。
AI芯片市场已经吸引了不少巨头和初创公司的入局,2019年,在摩尔定律放缓的背景下,内存墙的问题更加明显,同时,AI技术的进步以及资本寒冬让AI芯片的落地更显关键。CCF-GAIR 2019 AI芯片专场将邀请学术专家解读AI芯片的发展趋势,芯片产业链上的不同企业也将共同探讨AI芯片发展的最新动态。详情参见活动链接: https://gair.leiphone.com/gair/gair2019
相关文章:
耐能获1800万美元A1轮融资,曾投资Facebook的维港投资领投
。