异构智能吴韧:对标英伟达和 Google ,要做专用的 AI 芯片
离开百度的两年里,吴韧创办了一家做 AI 芯片的公司——异构智能(NovuMind)。但在很长一段时间里,关于吴韧的去向和这家公司在媒体报道中几乎处于噤声状态。
按照吴韧一贯给人看似“低调”的性格,没有做出一定的成绩,或者足够满意的产品出来之前,他也应该不会急于向外界发声。
不过,关于他们的报道在近期逐渐多了起来,异构智能这家公司也逐渐地浮出水面,它不再选择沉寂,而是开始向外“推销”自己。
10 月 24 日,异构智能举办了一场媒体沟通会,吴韧向包括雷锋网在内的十多家媒体整体介绍了异构智能这家公司和他们做的 AI 芯片。关于吴韧的简介,以及异构智能的应用案例,已在此前吴韧接受 (公众号:雷锋网) 专访文">雷锋网专访文 中进行详细介绍,此番不再赘述。
本篇主要介绍异构智能的 AI 芯片跟其他公司的芯片有何不同?它瞄准了芯片市场的哪些应用场景?凭什么吴韧说异构智能的芯片对标的是英伟达、Google 这样的巨头?
全栈式的 AI 解决方案
在这场人工智能浪潮中,其中获利最大的公司之一应该是 AI 芯片巨头英伟达,在不到两年的时间内,它的股价翻了近 10 倍,变身为一家市值千亿美元的巨头公司。
相较而言,传统硬件巨头英特尔则处于一个追赶者的角色,但不甘落后使得它在今年 3 月以 153 亿美元收购 Mobileye,将赌注押在了汽车行业。另一巨头 Google 作为传统互联网公司,也紧跟步伐,积极部署人工智能芯片。
吴韧将英伟达的成就归咎于它为其他的 AI 公司提供了训练模型最基础的计算力。
算力是决定人工智能发展重要的一环,异构智能也希望凭借芯片进入各行各业,不仅能为其他人工智能公司提供计算能力,还要为非人工智能公司提供计算或者智能的能力,帮助它们进行人工智能落地。 换句话说,也就是要能对不同行业提供全栈式的 AI 解决方案。
异构智能的思路是既有芯片,又有模型、超级计算机,将模型脱离云端,带到本地和终端,让终端变得智能。“超级计算机可以训练模型,让模型和芯片进行配合,让芯片最后可以做某一个模块的功能。”
这跟做平台的思路有很大的不同。平台更多是做一个标准,要求大而全,这样做“会有额外的负担”,而异构智能要做的正是优化这些额外的负担,做出极端定制化的 AI 芯片。
按照这样的设想,异构智能就会有很多应用场景的想象空间。比如,他们已经与合资公司做了智能医疗,也会涉及智能安防、智能驾驶、智慧城市等领域。目前的合作者中有 HP、KUKA 这样的大公司,通过类似于 2B2C 这样的业务模式,把这些 AI 能力赋予给它们各自的用户。
高性能-低功耗的 AI 芯片
“芯片用电量与市场规模成反比”,异构智能在两年前成立的时候就发现了这一点,所以希望将人工智能的能力用最小的功耗实现,他们觉得这是异构智能打开未来大门的机会。
机会与挑战共存,挑战的一面在于把 AI 放在终端上的芯片要高性能,因为人工智能的计算很复杂。其次需要低功耗,因为要放在很小的一块地方上,要付出巨大的努力。
那异构智能又如何去做这样一款 AI 芯片?吴韧介绍说,这款芯片不会用来上网,或者做一些其他计算。 “它擅长的是在三维上做卷积张量的计算,把人工智能的计算加速。”
一般的 AI 芯片需要 10TOPs 的计算能力才能把应用实现,在吴韧看来, Google 等公司的芯片计算能力很强,但耗电能力同样也很高,这就难以满足人工智能在本地落地的条件。耗电相对较低的 Movitus、高通、寒武纪麒麟 970 等芯片,却在计算能力上比他们所想要的少了两个数量级。
而拿异构智能即将推出的 5W15TOPs 芯片来说,“5W 是 USB 可以提供的电量,使用这样电量的芯片会有很大应用空间,从而实现从云端到终端的突破能力。”吴韧介绍道。
问题是,既然连英伟达、Google 这样的巨头都还没做能同时满足两种需求的芯片,异构智能作为一个创业公司说自己的芯片做的比他们好,底气来源于哪里?
“专用性”是吴韧提及最多的特点。“在公平的世界,有得就有失,要扔掉一些东西才能得到一些东西。”显然,异构智能牺牲的是通用性,转而把目光放在了全栈和垂直优化上。他继续解释说,“当年 GPU 赢过 CPU 就是因为 GPU 比 CPU 专用。”如今,对专用性的追求,从某种意义上讲也自然被异构智能看做是与巨头抗衡甚至“打败”它们的重要特质。
而从计算方式比较,CEVA 和 Tensillica 的 DSP 芯片是在 1D 乘积累加运算(MAC)来完成操作的,而英伟达 TX 系列的 GPU 芯片运作的本质是使用了 2D 通用矩阵乘法(GEMM)。
但吴韧表示,人工智能的核心计算是三维张量的卷积计算,在小立方体和大立方体重合的部分做点乘。目前只有异构智能的芯片在三维层面做操作,并且他们已经有四项专利保护。
第一项专利是三维张量的卷积,这是人工智能最重要的操作,可以用硬件直接实现。其他三项专利是对数据的调度与分配、归并,处理器间的协作。
为了说明三维张量卷积计算的优势,他用吃冰激凌的方法做了个更形象比喻:冰激凌可以用手沾着吃,但没有效率;可以拿吸管吸,效率也不是很高;更厉害一点的是用一个小平面吃,但也不是最优;最好的方式是用一个三维的专用勺子吃冰激凌。
对标英伟达和 Google
除了核心计算方式不同外,在具体的应用场景上,吴韧也谈了谈跟巨头如何竞争。比如,自动驾驶也是英伟达所要发力的领域,他们的 30W30TOPs 的芯片是主推产品。但吴韧对英伟达在无人驾驶领域的芯片表示了质疑,认为后者的判断不够精确,“原来想 Centralized Process,但是所有人都低估了其中的难度。”他进一步强调说,30TOPs 的芯片使用在自动驾驶上可能并不足够,也许需要分布式的计算。
当然,无人驾驶汽车有雷达、毫米波雷达、摄像头等多处需要处理器的装置,然后需要把处理的结果进行计算。 “当有很多芯片的时候,异构智能和英伟达的区别就体现出来了。” 他说。
就在媒体沟通会当天,自喻为“中国版英伟达”的深鉴科技宣布完成 A+轮融资约 4000 万美元,吴韧表示对国内很多公司不便评价,但他说异构智能目前的芯片对标对象是 Google TPU 和英伟达 GPU。
从整个市场来看,根据智研咨询发布的《2017-2023 年中国人工智能芯片行业研究及未来发展趋势报告》,可以看到 AI 芯片市场规模增长迅速。据统计数字,2016 年人工智能芯片市场规模达到 6 亿美元,预计到 2021 年将达到 52 亿美元,年复合增长率达到 53%,增长迅猛,发展空间可期,但由此可以预见这个巨大市场在未来的竞争将会多么激烈。
人工智能的发展空前火热,物联网这个概念近几年却一直都是半温不火。吴韧则直接表示物联网是一个伪命题,难以实现。“物联网看起来可以魔术般的连起来,但实际上要通过很多的海底光缆或地下光缆连接起来,是从分支道路到主干道连接的。”而主干道是国家资源,需要国家投资才能持续扩大。
他认为最好的解决方案是将人工智能的能力从云端拿到终端,让“小东西”有思考能力,然后将它们思考的结果通过网络与世界连接。 “I 2 OT(智能物联网)才是未来唯一的可能。” 他笃定地说道。基于此,异构智能的定位就很明确了: 在万物互联转到万物智能的过程中,将人工智能从云端延展到终端,为“智联网”赋能。
*来自雷锋网报道
。