挑战英伟达,这家独角兽又募了1亿美金
来源:融中财经(ID:thecapital),作者:郑伟
AIGC热潮带火了大模型,也带火了整个AI芯片赛道。不过,当中受益最多的,则是手握高性能AI芯片的英伟达。作为训练AI用的必备硬件,英伟达的高端芯片瞬间走俏,甚至是“一卡难求”。
本周英国《金融时报》报道,为了确保在“百模大战”的竞争中胜出,以百度、腾讯、阿里巴巴和字节跳动为代表的互联网巨头一口气向英伟达下了50亿美元的大单,来争抢高性能AI芯片。实际上不止中国企业,国外的OpenAI、谷歌、META、亚马逊等,所有搞生成式AI的企业,都极度依赖英伟达的AI芯片来训练。
有统计数据显示,目前,英伟达已占据全球AI计算芯片市场的80%到95%份额。绝对的市场垄断为英伟达带来了巨大收益。自2023年年初以来,英伟达股价已经增长了170%。在英伟达发布了2023年第一季度财报后的短短一周内,其股价更是飙升超过了25%。截止到5月底, 英伟达 股价一度创下419.38美元的历史新高, 成为全球第一家市值超过万亿美元的芯片企业。
01 挑战英伟达这家独角兽又募了1亿美金
有垄断的地方就会有挑战者出现。加拿大AI芯片初创公司Tenstorrent,便是一家勇于向巨头发起挑战的新锐企业。
Tenstorrent的AI芯片(图片来自tomshardware.com)
路透社近日报道,Tenstorrent公司成功从现代汽车集团和三星的投资基金中筹集到1亿美元。这笔资金将用于研发团队的开支与投入,比如人工智能芯粒(Chiplet)的开发,及其机器学习软件路线图的制定。
此轮融资是Tenstorrent公司迄今为止的第7轮融资。与以往不同,本轮资金来源不是传统风投机构,而是从现代、三星这样的利益相关产业合作伙伴处募得。
本轮融资的资金分为三个部分:现代汽车集团3000万美元,起亚汽车2000万美元,剩下5000万美元来自三星Catalyst Fund和其他投资者,包括富达风险投资、Eclipse Ventures、Epiq Capital和Maverick Capital等。
在获得本轮融资之前,Tenstorrent就已筹集到2.345亿美元,估值达10亿美元,成为一家独角兽新贵。截至目前,Tenstorrent已筹集资金总额超过了3.5亿美元,最新估值有望提升至14 亿美元以上。
现代汽车集团执行副总裁兼全球战略办公室(GSO)负责人Heung-so Kim表示,“Tenstorrent的高增长潜力和高性能AI芯片,将帮助集团确保未来移动出行获得有竞争力的技术。通过这项投资,集团希望开发优化出有差异化的半导体技术,以帮助未来的智能汽车发展,同时增强人工智能技术开发的内部能力。”
三星电子执行副总裁兼三星半导体创新中心负责人Marco Chisari也指出,“Tenstorrent行业领先的技术、高管领导力和积极的路线图促使我们共同领导这一轮融资。我们很高兴有机会与Tenstorrent合作,加速人工智能和计算创新。”
除了对这家新锐企业的肯定外,实际上吸引到产业伙伴与投资方关注的,是芯片领域的传奇人物Jim Keller的加入。
02 锄强扶弱人送绰号硅谷游侠
对于Jim Keller,可能大多数人并未听说过,但如果在芯片产业里提及他的名号,相信会被不少人视作“神”一般的存在。从业近40年的他,入职扶持过AMD、Intel、苹果、特斯拉等科技巨头。有业内人士调侃,他这是为了照顾芯片产业的均衡发展,所以就有了“硅谷游侠”的叫法。
1984年,Jim Keller从宾西法尼亚州立大学获得了电子工程学士学位后,便投身于芯片行业。尽管没有读研攻博,但却天赋异禀靠实力在净是高学历人才的芯片界混的风生水起,还能在各大芯片巨头企业间“横着走”,成就了一代传奇。
毕业后,Jim Keller首先加入了当时风头正劲的DEC公司,并在那里工作了整整15年。期间,Jim Keller从一个芯片小白逐渐变成了一位能够独当一面的芯片架构师。他参与并主导了Alpha 21164和21264两款处理器的设计,而这两款处理器日后对许多架构师和设计者都产生了深远影响。
在离开DEC后,Jim Keller便开启了他开挂般的芯片设计人生。1998年,他加入了AMD,协助研发了AMD Athlon(K7)处理器,并担任了处理器K8的架构师。通过K8架构,AMD首次具备了与Intel竞争的实力。同时,他参与了X86-64的架构设计,令AMD在技术路线上第一次超越了Intel。两项成就使得Jim Keller声名大噪。
1999年,Jim Keller加入了Sibyte,从事基于MIPS架构的网络处理器研发,设计出1Gbit/s网络接口的MIPS芯片。当时他不知道,正式MIPS架构为后来的苹果A系列芯片奠定了基础。2004年他离职加入了P.A. Semi。
2008年,苹果公司收购了P.A. Semi,Jim Keller自然进入苹果公司,并参与到苹果自研芯片的设计中。任职期间,他主导设计了A4、A5两代移动处理器,应用于iPhone 4/4s、iPad/ iPad2等设备,成为苹果A系自研芯片的起点。据说乔布斯对这两款自研芯片非常满意。因为此前iPhone 3使用的是三星芯片,现在可以使用自主定制芯片对乔布斯来说是一大进步。但Jim Keller并不留恋已有成绩,在苹果A系列芯片大热之际,选择重回AMD。
2012年,当时AMD在PC处理器设计上又远远落后于Intel。Jim Keller决定重回落败的老东家,带领开发了代号Zen(禅)的革命性微架构。Zen架构号称可以将AMD处理器的性能提升40%,但当时很多人并不相信,认为是夸大其词,然而事实证明了一切。Zen成为AMD历史上最著名的架构,一举扭转颓势,帮助AMD逆袭夺回高端x86-64处理器的领先市场地位。Jim Keller也因此获得了"Zen之父"的美誉。
2015年,Jim Keller再次功成身退,离开了AMD。而这次他将加入特斯拉,仗义相助埃隆·马斯克。在特斯拉工作三年,他开发设计出面向自动驾驶的AI芯片——Autopilot,据说有100万的出货量,为特斯拉实现完全自动驾驶打造了硬件基础。
2018年,面对失去芯片产业领先地位的Intel,Jim Keller又重新来帮他。任职高级副总裁,主导前沿探索项目NGC架构的研发,以提前布局未来十年。据称,在Intel,他曾领导多达10000人的工程师,估计这个记录将无人能够打破。
时间来到2021年,英伟达正拿着A100(当时业内最高性能AI芯片)大杀四方,没有个敌手。不过“游侠”眼里怎容得了沙子。Jim Keller决定离开Intel搞AI芯片,于是加盟到前面所提的Tenstorrent公司,目前担任CEO。
从履历上看,Jim Keller从业近40年来,先后参与了Alpha、MIPS、X86、AI及ARM等不同指令集的芯片研发,可以说把主流指令集都过了一遍了。自加入Tenstorrent后,助公司在强敌环伺的AI芯片界迅速建立起口碑,并且拉到融资,相信与这位芯片设计大神的参与不无关系。
03 初生牛犊不怕虎AI芯片迎来挑战者
Tenstorrent成立于2016年,由前AMD Ljubisa Bajic、Milos Trajkovic和Ivan Hamer创立,在多伦多和奥斯汀大约有70名员工,算是名副其实的“小公司”。不过公司的关键成员都有芯片设计背景,甚至堪称“芯片设计天团”。除了上面介绍的Jim Keller外,创始人Ljubisa Bajic就曾是英伟达和AMD的资深架构设计师,但现已宣布退休,转而担任顾问,后续仍会继续探索下一代AI解决方案。
Jim Keller的前同事Intel前首席架构师Raja Koduri也加入为Tenstorrent董事会成员。其对英特尔技术和架构有诸多贡献,尤其是在2022年将高性能图形业务的3条新产品线推向市场。“他是业内为数不多的了解CPU、GPU、AI和半导体业务方方面面的人之一,对Tenstorrent的业务增长来说是一笔巨大的财富。” Jim Keller介绍到。
另外,Tenstorrent Ascalon的首席架构师是Wei-Han Lien,他曾是负责苹果“宽”CPU微架构的设计师之一,该架构每个时钟最多可执行8条指令。例如,Apple的A14和M1 SoC具有八个宽的高性能Firestorm CPU内核,在推出两年后,它们仍然是业内最节能的设计之一。Lien可能是业界“宽”CPU微架构方面最好的专家之一,据悉,他是唯一一位领导工程师团队开发八宽RISC-V高性能CPU内核的处理器设计师。
了解完团队骨干,我们再看看Tenstorrent公司的产品。他们计划以异构和Chiplet(芯粒)设计的形式来开发RISC-V和AI芯片。目前Tenstorrenst已经开发出基于12nm工艺的Grayskull和Wormhole两款芯片,FP8算力高达328TFlops。其中,Grayskull包含120个定制内核,拥有强大的TENSIX处理核心阵列,每个TENSIX核心具备完全C++可编程、多线程、前端功能;高面积和功率效率矩阵计算引擎;强大灵活的SIMD引擎等。而该公司最近还将推出Black Hole 独立ML计算机芯片,采用6nm工艺打造,基于用于异构运算的SiFive RISC-V X-280架构,计划于今年推出。同时,整个软件栈只有约50,000行代码。与大多数其它需要定制开发流程的AI专用集成电路(ASIC)不同,Tenstorrent的适应性和灵活性非常强,支持所有主流工具链、框架和运行时。所以英伟达的最大优势——极易开发,正在受到挑战。
在高性能AI芯片方面,Tenstorrent计划于2024年推出可对标英伟达最新发布的GH200 Grace Hopper平台,通过3nm的CPU芯粒和ML/AI芯粒相结合的高度可配置高性能设计。CPU侧有16个核心,而AI小芯片则包含40个核心。AI芯粒群和CPU芯片各拥有四个内存芯粒,并且整个芯片组连接到IO芯粒来扩展PCIe等功能。
Jim Keller表示, Tenstorrent的目标是可以比类似性能的GPU系统便宜5到10倍。 我们使用的内存带宽要少得多,因为我们有一个图形编译器,而且我们的架构比GPU更像是一台数据流机器,所以可快速将数据从一个处理元素发送到另一个处理元素。这样就避免了使用昂贵的HBM硅中介层。同时,我们的芯片上有网络端口,利于通过网线互联组成大型阵列集群进行横向扩展,而无需通过其他交换机。从技术上讲,这就是我们的方法比英伟达的方案更便宜的原因之一。此外,我们还支持开放的技术许可转让,方便大家构建生态。
04 AI芯片赛道迎来新风口国内玩家几何
尽管挑战者不容小觑,英伟达仍然在AI芯片领域占据了绝对的领先地位,在云端训练和推理场景中占据绝大部分市场份额。除了英伟达,还有AMD和英特尔。不过随着我国的大力发展,近几年国内也有不少企业进入这个赛道,逐步取得进展。
据IDC预测,中国AI算力规模将保持高速增长,预计到2026年将达1271.4EFLOPS,CAGRA(2022-2026年)达52.3%。在此背景下,IDC预测异构计算将成为主流趋势,未来18个月全球人工智能服务器GPU、ASIC和FPGA的搭载率均会上升,2025年AI芯片市场规模将达726亿美元。国内企业如寒武纪、平头哥等1.0时代的玩家,现已成为优质AI算力芯片的上市公司。另外,也有越来越多的AI芯片初创企业积极加入,包括各方资本在此领域不断加大投资力度。
以2022年为例,摩尔线程、天数智芯、沐曦、登临科技、深流微、凌久微电子、砺算科技等多家企业获得资本融资。其中,摩尔线程15亿、天数智芯超10亿、沐曦10亿,这三家的融资金额较大。
摩尔线程成立于2020年10月,是一家以全功能GPU芯片设计为主的集成电路企业。目前,摩尔线程已经发布两颗基于其MUSA统一系统架构打造的多功能GPU芯片——“苏堤”和“春晓”,以及系列GPU软件栈与应用工具。
天数智芯在2022年7月宣布完成超10亿元的C+轮及C++轮融资。该公司是一家研发、生产GPGPU高端芯片及高性能算力系统提供商,2018年开始启动云端7nm GPGPU芯片研发。2021年3月正式对外发布7nm云端训练通用GPU产品——天垓100。截止至2022年3月底,天垓100实现销售订单近2亿元,落地200多个应用场景。
沐曦于2022年7月5日宣布完成10亿人民币Pre-B轮融资。这是沐曦2020年9月成立之后的第五轮融资,总计获得超20多亿元投资。沐曦第一颗高性能通用GPU芯片于2022年1月顺利流片,采用7nm工艺,以AI推理为主,可应用于人工智能、自动驾驶、工业和制造自动化、智慧城市、自然语言处理、边缘计算等领域,计划2023年量产,可应用于AI训练、科学计算的更高端芯片,研发已进入收尾阶段。
大模型时代,算力已成至关重要的基础设施。为满足AI和HPC激烈的市场竞争,需要实现高性能和通用性兼备的算力支撑。随着AI算法与芯片架构绑定越来越深,我们期待在国内也能看到如Tenstorrent这样敢于挑战巨头的AI芯片企业越来越多,在技术上进行架构创新,在生态上步步为营。当然也期待各方资本的积极涌入,共创共赢。