昆仑芯研发总监罗航:AI芯片产业发展和昆仑芯应用实践
近日,昆仑芯 科技 应邀出席百度技术沙龙第99期“智能芯片”专场:昆仑芯一周年——构筑国产数智基石,AI算力赋能千行百业。四位专家首次同台,揭秘十年磨一剑的中国芯的神秘技术面纱,并系统介绍昆仑芯两代产品赋能千行百业的最新成果及应用实践。
本篇以下内容整理于沙龙第四位演讲嘉宾——昆仑芯科技研发总监罗航题为 “AI芯片产业发展和昆仑芯应用实践”直播分享。
昆仑芯科技研发总监罗航
我是昆仑芯科技研发总监罗航,今天分享AI芯片产业发展和昆仑芯应用实践,主要围绕以下四个问题:
1. AI芯片为什么是产业发展的必然趋势?
2. 聚焦到国内的AI芯片产业,宏观变量怎样影响AI芯片产业的供给端和需求端?
3. 国内的AI芯片公司要实现产业化需要跨越哪些门槛?
4. 昆仑芯在产业化道路上做了哪些探索和实践?
AI芯片是产业发展的必然趋势
整个计算产业的周期基本上可以粗略划分为四个阶段:
1. 互联网 上古时期。它是一个定制化的UNIX操作系统,主要群体是科学家,它的互联网形态,是一个很小规模的局域网形态。
2. PC互联网。这个时候才真正进入了普罗大众,我们才能感受到计算产业的魅力。它和上古形态有很大区别,它形成了一个x86 Windows强生态组合,有很多应用百花齐放。
3. 移动互联网时代。这个产业形态的组织形式是基于3G、4G乃至5G的移动互联网,相比上一个阶段,它的网络规模和通讯速度有一个质的飞跃,并且产业形态有一个很重要的变化,可以看到这张图中间出了一条线,这条线代表分化。它分化成了左边移动端的架构和右边中心端或叫云端的架构。为什么会有这样分化?因为在移动互联网时代,原先x86和Windows的组合没法满足移动端低功耗的场景,所以分化催生出了ARM加Android和IOS的生态,形成了移动端和云端并存的形态。
4. AI时代。可以看到它的分化更复杂了。为什么会出现这样的分化?因为AI的蓬勃发展,导致数据量爆炸以及计算需求的爆发式增长,传统CPU通用计算提供的算力,已经远远不能满足AI时代的计算需求,所以催生出了多种计算架构,不同的计算架构处理各自擅长的数据需求,AI芯片应运而生。多种计算架构的有机整合就叫异构计算。未来很有可能还会沿着这种分化趋势继续演变。
从这里可以看到,计算产业体系结构的演化很像生物的演化,都是从简单到复杂,比如生物演化是从单细胞到分化出各种器官,从而组成复杂精密的人体。我们借用“十九大”对社会主要矛盾的表述:人民群众对计算的需求,与计算系统的算力发展不平衡之间的矛盾,驱动着整个产业的迭代和发展。
每一次的迭代、分化,都会涌现出巨大的产业机会。
这张图表达的是一个客观事实:AI模型的规模呈指数型爆发式增长。模型在某种意义上等同于数据,模型越来越大代表数据量越来越大。模型简单来讲就是经验,相对于人是经验,相对于机器就是模型。图中有前段时间非常火的GPT3,这个模型的参数量达到了1750亿个,后来Google又发布了一个1.6万亿的超大模型。国内有很多机构也推出了大模型,百度前段时间就发布了文心大模型。
大模型是现在正在发生的事实,是很大的趋势。模型越来越大,对算力的要求就越来越高。上面这张图也从侧面佐证了计算产业的发展和分化的趋势。
可以看到,AI芯片跟CPU一样,处于整个生态的基座位置,它提供了算力,跟CPU等各种架构的芯片一起组成异构计算。在这样的AI生态基础之上,我们才能实现各种垂直行业的智能化场景。
国内AI芯片产业机遇与挑战并存
在宏观层面,目前有两大变量。一个是疫情,一个是国际形势。疫情极大加速了数字化和智能化的产业趋势,把原本十年才能完成的产业转变压缩到五年。
我重点讲一讲国际形势可能会造成的影响。国内很早就开始造芯片,包括CPU芯片,但为什么好像没形成气候?实际上国内缺的不是人才、资金、技术,缺的其实是市场生态——比造不出来芯片更麻烦的是卖不出去。原先国际形势没有那么激烈冲突时,国外的芯片是敞开卖的,这导致国内的芯片需求是锁死的状态。现在国际形势为国产芯片打开了一扇窗,相当于需求侧解锁了,由此带来国内供给侧的蓬勃发展。AI芯片相对于CPU又是一个新的需求赛道。现在国内也有很多企业都聚焦到AI芯片赛道做产业的升级迭代。
宏观趋势的影响为国内AI芯片产业带来了机遇,同时也带来了挑战。
• 从机遇方面来说,这是一个新的市场、新的赛道:
需求侧:相对于传统CPU来讲,AI芯片是比较年轻的产业。目前国家提倡新基建、智能化等各种政策扶持整个国内市场,同时全球的生态格局还没固化,这就为国内AI芯片 创业 者提供了需求侧的机遇。
供给侧:现在摩尔定律最新的工艺开始研究2nm,如果工艺越来越先进,尺度越来越小,会面临一个量子隧穿的效应。这不仅是工艺的问题,还可能涉及到物理学、材料学等方面,需要依赖基础科学的突破。也就是说,摩尔定律很有可能已经逼近极限。这意味着领先者快撞到墙了,国内的追赶者缩小代差就只是一个时间问题。现在无论是芯片的设计还是制造研发,都已经有全链路和28nm的工艺储备,所以中国具有资本、技术和人才的后发优势。
• 与此同时,我们也面临很大的挑战:
需求侧:国内AI芯片或者AI产业还处于发展的早期阶段,非常不成熟,特别是 商业 化很不成熟,需求也还没爆发。大家都在寻求AI芯片与自身产业的结合,即如何用AI升级自己的产业,这是产业早期的一个特征。
供给侧:我们跟国际代际差距非常大。不仅表现在硬件上的差距,也表现在软件和生态上的差距。特别是从设计、制造到封测等这一条产业链上,比如EDA工具、光刻机等,我们与国外都存在巨大的代际差距。
综上可以看到,国内的AI芯片产业,机遇和挑战并存。
国内AI芯片产业要跨过三道窄门
1. 首先是量产。做芯片要有米下锅,AI芯片就是我们的米。如果要让AI芯片产业持续发展,形成商业的正循环,量产是前提。大家都知道,量产可以极大摊薄先期流片的巨大投入,通过量产摊薄成本是实现盈利的唯一方式,量产也是衡量芯片成熟度的指标之一。
2. 软件生态。其实这是整个行业正在面临的问题,或者说是我们需要跨过的窄门。如果我们只有芯片而没有软件生态,客户不太好把它用起来,也就没法完成价值的传递。为了让客户更好地把它用起来,我们构建一个合理、合适的软件生态,是非常有必要的。国际上的友商构建了一个非常强大的软件生态,通过这个软件生态,很多开发者和厂商能够很好地用起来,这个软件平台也构筑了很强大的壁垒。作为国内的产业玩家来说,软件生态的构建也是非常重要的。
3. 落地,做产品化。如果只有软件生态还远远不够,还需要跟具体的垂直行业做产品化。芯片是无法独立存在的,必须要和垂直行业结合起来才能实现价值传递。这也是现在产业面临的问题,因为没有产品化,所以我们不得不做项目。不知道大家是否理解这个表述,做项目和做产品的区别是什么?做项目是case by case,做产品相对通用化,边际成本递减,这是芯片商业模式成功的关键因素。成熟的产品有量产规模,用强大的生态构建产品化,做成商业闭环,才能形成商业飞轮。
AI芯片的产业化机会
可能有人会问:产业化机会到底在哪?怎样去做产业化,在哪里可以找到产业化的场景?
首先,AI芯片一定要跟各种产业结合。接下来我会站在更广义的AI的概念讨论,而不仅是AI芯片。因为有AI的地方,就需要AI芯片提供算力支持。
在这里给大家提供一个分析框架和思路。我们现在所说的人工智能,假如对照本来就有智慧的人来说,AI应该具有哪些特征和要素?借用佛家的说法,人具有六根,眼、耳、鼻、舌、身、意,这是生而为人的基础。那么,AI产业化的六根是什么呢?
• 眼,计算机视觉,赋予AI“看”的能力。这是目前AI应用最广泛的领域。比如安防监控、园区监控。如果我们把全球的AI看作一个整体,所有采集光信号的设备,无论是路边摄像头、 手机 摄像头,还是光传感器,都可以看作是全球AI的“眼”。
• 耳,语音处理,赋予AI“听”“说”的能力。比如语音识别、语音合成等场景,所有采集和处理音频信号的设备,都可以看作是AI的“耳”。
• 意,NLP的自然语言处理,赋予AI读写和理解的能力。这一应用领域非常广泛,包括文章理解、知识图谱、知识提取、知识检索等。
除了这三个领域外,我们完全想象不到“鼻、舌、身”是什么样的场景。目前AI完全无法具备嗅觉,也无法具备味觉、触觉,也就是说现在还没有能够采集这些信号的传感器、设备,或者说这些场景还没被挖掘出来。所以,相比于人,AI还差得很远。就仅仅拿计算机视觉这个AI最成熟的领域来说,相比人眼的识别效率来说也相距甚远。
反过来看,有差距的地方或者空白的地方,不正是产业化的机会所在吗?我们把“六根”整合起来看,一个完整的AI体系,既要实现所有现实信号——眼、耳、鼻、舌、身、意,即全时空信号的捕捉体系,也就是数据生产;又要有信号处理体系,比如数据消费,所以AI与IoT的结合一定是未来产业化的大方向。
AIoT,就是万物数据——万物在现实中捕捉到的万物的数据,再加上超强的算力支撑的数据处理能力,一起组成的一个整体。IoT和AI这两者都处于快速变化的发展阶段,所以这两者的结合机会是非常多的。物联网负责海量的数据生产和消费,AI芯片负责数据的处理和再造,两者是相辅相成,或者说螺旋迭代、缺一不可。
昆仑芯的探索与实践
接下来讲一讲昆仑芯的实践和应用案例。
昆仑芯有非常成熟和完善的全栈国产化的技术生态。从底层往上看,所有你知道的国产CPU和国产操作系统,我们都做了适配,而且适配得非常完善。再往上还有国产的深度学习框架,代表就是PaddlePaddle(百度飞桨),我们也做了适配。同时,我们还提供了昆仑芯的推理框架,以及之上的国产算法。我们可以基于这样的生态去做很多国产化的行业落地。
在智慧政务、智算中心、智慧 金融 、智慧电力这些方面,我们都有很多探索和落地:
1. 智慧质检。我们已经跟国内某质检厂商深度合作,打造解决方案并落地,也上了《新闻联播》的报道。
2. 智算中心。这是非常典型的应用场景,现在国内智算中心的建设也如火如荼。昆仑芯可以为当地提供稳定的算力支撑和算法服务,助力当地的产业升级。
3. 大规模知识检索。简单理解就是搜索,其实百度搜索引擎后面算力的支撑,很大一部分都归功于昆仑芯。我们在百度的搜索集群大规模上线过万片,稳定运行了很长时间。
这三个典型案例,是我们助力新基建案例探索很小的一部分。
接下来结合“六根”这个分析框架展开讲讲。比如这个案例就是“眼”与昆仑芯的一个结合,在高速的流水线上自动化作业。这个生产节拍是很快的,一个节拍可能一秒,甚至不到一秒,如果人眼去判断产品是否有缺陷不仅非常费眼,也非常费人力。经过昆仑芯算力的赋能,再加上AI的“眼”,即工业相机/光源阵列去拍摄产品图片,通过计算机视觉来识别产品是否有缺陷,极大提高了工业高速公路流水线的自动化和作业效率。
这也是“眼”加昆仑芯的一个案例,是我们落地到某个智慧城市云边一体的案例。摄像头作为“眼”,看到了很多视频流进来之后,在边缘侧有搭载昆仑芯2代产品R200的分布式边缘设备。在这个设备上可以完成解码并同时进行AI检测,完成整个全链路。比如说可以做边缘侧的一些粗略识别,提取视觉的一些特征,也可以把大图切成小图,然后跟中心侧的集群配合起来,中心侧的集群是以昆仑芯算力构成的极大规模的集群基座。边缘侧把经过的信息进行初步处理之后,跟中心侧配合起来,就可以实现云边一体的AI落地案例。中心侧集群还可以比较方便的关联人脸的数据库和布控数据,这就形成了一个比较典型的安防系统架构。
这是“意”加昆仑芯的一个落地场景,是在某省高检的一个落地项目。它实现了检察院业务的全流程和全数字化。检察院有很多文档,不管是PDF、Word,有很多文档,如果由检察官人工分析文档的话,会很费时、费力,而且很难形成可复用可传播的知识体系。如果通过计算机把文档读取进来,给它做OCR文字识别,再做文档特征和知识提取,塞入到知识图谱中构建知识网络,再部署一套私有化的检索系统,就能很好地实现文档的数字化和智能化。这其中所有的业务流程全都是基于一个AI智能开发管理平台搭建的。管理平台里面也搭载了昆仑芯的算力集群,集群里还内置了一些面向开发者的技术栈、深度学习框架、深度学习模型库等,可以让第三方开发者或客户自行在平台上做特定模型的重新训练,以及生产环境的自动化部署。
再讲一个“意”加昆仑芯的案例。这是大规模知识检索的在线服务,类似于百度的在线检索系统。可以看到,用户在搜索框中输入关键字或很多关键字的组合,发起请求之后,有一个在线的推理集群去分析用户的搜索意图,再结合用户画像去分析用户想问什么,然后做一些embedding,从离线训练的集群中找出了很多物料,从这里面找出一个跟用户意图最匹配的物料排序,最后在精排之后返回给用户最佳的检索结果。可以看到,在线集群和离线集群都有昆仑芯的应用案例。
上面介绍到了很多真实的落地案例,接下来我介绍的是一种商业模式,这是目前昆仑芯已经在运作的一种商业模式,我们叫做技术赋能模式。
昆仑芯可以为赋能伙伴提供以下支持。比如说如果你买了昆仑芯的产品后,就可以得到贴心的技术支持,或者如果你想要做自己的板卡产品,我们也可以卖芯片给你,你可以封装成自己的板卡。如果你对在昆仑芯上开发不是很熟,我们还可以手把手教你编程,教你在昆仑芯上怎么去开发算子和模型。我们也会提供培训课程,还会提供很丰富的demo给你参考。如果你基于昆仑芯的产品要做项目交付,昆仑芯也可以支持你做定制化模型和定制化服务器的适配。总之,通过技术赋能,赋能伙伴可以基于昆仑芯去开发自己的硬件和软件方案,去触达更多的场景和客户,做更多的AI芯片产业化、智能化升级改造的项目。
我们希望有更多的产业伙伴能跟昆仑芯一起,为国家的智能化产业升级做更多的贡献,一起共创智能化产业的新时代。