盘古Chat来袭，华为产业链能否迎风翻盘？ | 速途网

速途网 • 1年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

2023年伊始，继国内百度文心一言、商汤日日新SenseNova大模型体系、以及阿里巴巴通义千问、科大讯飞星火大模型等相继发布之后，华为也加入AI大模型的行列。

近日，有媒体报道称，华为公司即将推出一款名为”盘古Chat”的多模态千亿级大模型产品，直接与ChatGPT进行竞争。

有资料显示，盘古大模型于2020年11月在华为云内部立项成功，对于盘古大模型定位，华为内部团队确立了三项最关键的核心设计原则：

一是模型要大，可以吸收海量数据；

二是网络结构要强，能够真正发挥出模型的性能；

三是要具有优秀的泛化能力，可以真正落地到各行各业的工作场景。

随着国内多家企业相继推出类ChatGPT大模型，华为为了展示自己的大模型领域的积累，“盘古Chat ” 也即将问世。消息称，“盘古Chat ”预计将于今年7月7日举行的华为云开发者大会 (HDC.Cloud 2023) 上对外发布并开启内测，其产品主要面向To B / G市场，即政企端客户。

首个千亿参数中文预训练大模型

盘古Chat将打破人工智能“语言霸权”

公开资料显示，目前华为“盘古系列AI大模型”基础层主要包括NLP大模型、CV大模型、以及科学计算大模型等，上层则是与合作伙伴开发的华为行业大模型。

今年4月，在人工智能大模型技术高峰论坛上，华为云人工智能领域首席科学家田奇曾分享了“盘古大模型的进展及其应用”。他表示，盘古NLP大模型覆盖的智能文档检索、智能 ERP、小语种大模型等落地领域，2022年华为刚交付了一个阿拉伯语的千亿参数大模型。在应用方面，盘古大模型可以应用于智能客服、机器翻译、语音识别等多个领域，提供AI技术支持。

根据华为公布的一份论文数据显示，华为盘古PanGu-Σ大模型参数最多为1.085万亿，基于华为自研的MindSpore框架开发。论文中表示，PanGu-Σ大模型在对话方面的整体表现可能已接近GPT-3.5的水平。

自然语言处理（NLP）的技术演进和应用一直是最热门的赛道。然而，在AI演进的过程中，英语作为世界通用语言，占据了这个领域优势地位。就如同GPT3，英文占比为92.7%、法语1.8%、德语1.5%而中文语料只占0.1%。这意味着，英文之外的语料匮乏，会导致使用这些语种的国家在发展AI大模型的过程中遭遇更多阻力。

据介绍，盘古Chat是首个千亿参数中文预训练大模型，其中CV大模型则首次达到30亿参数的规模。华为官方表示，盘古CV大模型业界最大CV大模型、首次实现兼顾判别与生成能力，并在ImageNet上展现出领先的小样本学习能力；盘古气象大模型提供秒级天气预报；紫东·太初是全球首个图、文、音三模态大模型。

盘古大模型作为一款具有超大规模参数的产品，相比一般的大模型训练成本更高。但值得注意的是，大模型的参数量，并不意味着与其在语言处理方面的准确度和质量成正比。而在公开资料中，盘古大模型在语义理解方面仍存在一定的局限性，特别是处理复杂语言结构和语义推理方面。

大模型之家认为，中国发展大模型是形势所需，国内企业需要加强自主创新，掌握核心技术，避免被外部势力“卡脖子”，提升国家的竞争力和影响力。不过，目前市场上推出的大模型存在严重的趋同性，且多以“类ChatGPT”的形式亮相，因此华为盘古Chat能否通过自身的量变引起质变，仍然需要等到7月正式问世后才能得出结论。

入局大模型赛道

华为产业链能否迎风翻盘？

AI将进一步驱动各行各业的生产能力、生产效率从量变到质变，实现跨越式发展，而随着华为盘古Chat的推出，这也对计算提出了新要求。

与其他厂商相比，华为的优势或在于拥有完整的产业链和较强的算力调配能力。据浙商证券此前披露，在训练千亿参数的盘古大模型时，华为团队调用了超过2000块的昇腾910芯片，进行了超2个月的数据训练能力。

华为公司作为国内科技企业标杆，在AI芯片、算力等方面坚持国产化，其中，昇腾全栈AI软硬件平台构筑智能世界的基石，昇腾计算产业生态不断发展完善，为盘古大模型提供了底层算力支撑。

然而，在AI算力领域，英伟达具有绝对优势，旗下算力卡不仅成为了人工智能企业的香饽饽，甚至面对供货的封锁，甚至不惜加价购买英伟达显卡。而面对美国制裁，华为的AI芯片开发与生产被迫停滞。

华为内部称，每年大模型训练调用GPU/TPU卡超过4000片，3年的大模型算力成本高达9.6亿元人民币。

在华为盘古大模型产业链上，多家上市公司都与华为保持着深度合作。在盘古Chat正式发布后，相关公司有望从中受益。

值得注意的是，盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成，通过模型泛化，解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题，可以支持多种自然语言处理任务，包括文本生成、文本分类、问答系统等。

此外，在应用方面，盘古大模型可赋能多个行业，如智能舆情，智能营销，智能巡检，智慧物流等多种场景。

不过，由于“盘古Chat”主要面向政企端客户，大模型之家推测，盘古Chat应该不会大规模开放使用，通过强调功能的定制化，以及部署的数据安全性探索政企市场。这或将意味着华为的“盘古Chat”需要更多依赖华为现有的合作伙伴体系去推广，通过与现有合作伙伴的深度合作，华为可以利用其合作伙伴的渠道和市场资源，可能需要更多时间去经历市场验证和达成行业共识。

随着国内越来越多的人工智能企业正在积极探索大模型的应用，可以预见的是，在AI发展红利的驱动之下，将不断强化我国在大模型领域的核心竞争力，并提升我国在数据安全方面的治理能力，为我说实现数字化转型和智能化发展提供有力支持。