关于 DeepSeek 一体机落地真相,我们调研了 12 家上市公司

雷锋网  •  扫码分享

过去两个月的一体机市场,一波三折:

曾经半年销售量两只手数得过来的一体机业务,在年后一天涌进两三百人电话咨询、一周内咨询近千条,商机密度比往年翻两三倍,一体机“蜜月期”平等地降临在各厂商身上。

有行业人士透露,春节以来,中小厂商基本都卖出了十几二十台一体机,收入上千万;运营商能卖出小几百台;某大厂定下的目标是,今年卖三千台。

神州数码信创业务集团产品中心总经理李川也发现,去年对一体机的需求相对垂直,主要还集中在机器视觉、自然语言处理等领域中小型客户,今年则向更广泛的行业蔓延。

业务之外,还有更大的盈利场—— 在二级市场,DeepSeek概念股股价迎来较大涨幅,一体机相关上市公司也一度领涨。 2月以来,浪潮信息、优刻得、神州数码、云天励飞等股价陡峭攀升,深信服从半年前的42.70元/股涨到了最高142元/股,云从科技更是一度涨停。(更多一体机相关标的看法,可添加作者微信Ericazhao23交流)

而进入三月,商机有所回落,有运营商的咨询从每天几百个下降到每天几十个;股价也开始跌宕。当用户从尝鲜过渡到理性探索,当卖方市场开始产品迭代和探索壁垒,有声音认为,这个市场即将翻篇。

然而,这并非智算一体机首次爆火,前两年曾短暂风靡的一体机,能再次杀入大众视野,绝非偶然。于是,一个问题浮现:当我们需要智算一体机时,我们需要的是什么?

事实上,这个市场需要的不止是AI,还有一体机这种载体——

一方面,对于长期受定制化困扰的中国软件厂商,一体机通用、弱定制的产品逻辑,有望成为一剂解药;另一方面,对于习惯购买硬件重资产的本土客户们,一体机载体也能为其引入AI提供一种安全感。

同时,这场一体机部署热潮,也是如火如荼发生在B端和G端的AI普及教育,甚至,可以作为AI Agent来临前的地基建设运动。

“用户的热情此前从地上跳到空中,最后大概率会回到桌上”,云天励飞副总裁罗忆如此形容部署热潮。当市场情绪逐渐回归中点,雷峰网 (公众号:雷峰网) 也完成了多方调研,试图勾勒DeepSeek一体机市场里用户的迷茫、厂家的探索,以过去这两个月的市场为鉴,照见AI一体机蜿蜒向未来的道路。


咨询热情高涨,落地层层博弈

新的科技热潮出现,用户总需经历市场教育。

第一个场景,便是卖家的抉择。

1)急于完成KPI、在厂商间迷失的客户们

“短、平、快”,是这次一体机用户的需求特征。

此次部署热潮中,很多国央企和金融客户的KPI节奏大差不差:上半年完成部署,下半年应用落地。

部署指令自上而下,时间紧,任务重。焦虑急迫的情绪,从厂商发布的交付数据中可略感一二:联想集团与沐曦股份联合发布的首个国产DeepSeek一体机解决方案,一个月内发货量就超过千台。

不过,目前很多厂商的成单量跟咨询量比起来,仍显寥寥: 多家厂商的DeepSeek一体机成单率远不如其他成熟产品,有时两三百个咨询里没有一单落成,甚至有的用户只测试、不下单。

不得不承认,在早期市场上,更吃香的是懂点技术的中间商们。

他们成为香饽饽无非两个原因:便宜、快速。

但选择中间商,风险暗藏:很多企业接入大模型的第一步,是做知识问答,而足够精准的知识问答,要基于精确的RAG(检索增强生成)框架而做。

然而,现在市面上许多DeepSeek一体机订单,是由中间厂商直接用MaxKB软件或Dify平台给客户部署。结果上看,也能把知识库搭起来,但框架往往不够精确,知识库里的文字分段有问题,大模型幻觉严重:

当专业名词“阿莫西林”,被切割成了“阿莫”和“西林”,这场幻觉,谁来买单?

困住客户的不止于此:市面上还有厂家售卖的所谓一体机,只是“计算平台+推理框架+预装大模型”,没有智能体平台、没有操作界面,仍是开发机;有的厂家打着满血版的名义,却给客户部署蒸馏的模型;还有的厂家,四处东拼西凑出一体机,交付时却不负责调优应用。用户迷茫,做快生意的厂家却盆满钵满。

供给市场鱼龙混杂,一个重要原因是,前期一体机的利润不容小觑。“硬件成本下探空间小,软件长期服务更盈利”这套一贯的逻辑,用在DeepSeek一体机市场里还不够全面。有知情人士透露,得益于前几年英伟达H20囤卡风潮,此次一体机早期硬件利润不低,一台满血版的H20一体机,整体利润率可达30%。

不过,多位业内人士反映,这一利润率已在下降。(一体机背后利润几何?可添加作者微信Ericazhao23交流)

选对厂商只是第一步,此后还有一系列问题摆在用户面前:满血版还是蒸馏版?国产卡还是H卡?训推一体机还是推理一体机?具体切入什么场景?

每一关都是信息博弈,且每个A和B之间的抉择,成本也相去甚远。

2)咨询时都要满血版,落地时50%交付蒸馏版

满血版,是许多用户的第一个执念——领略过DeepSeek-R1的表现后,大家由奢入俭难。

但满血版在单台一体机上的性能到底如何,目前存疑。 用单台八卡英伟达H20,基于推理框架优化能让模型顺利运行,但性能会有一定损失。还有使用国产芯片的厂商表示,在DeepSeek“话很多”的情况下,一个问题的答案可能要五分钟才能吐完。

而价格上,满血版DeepSeek一体机一般在150万上下,内置国产芯片的还会更高。DeepSeek一体机国产卡的配置,目前以华为昇腾、沐曦、海光较多,但由于国产卡的显存资源和性能仍稍差,一般要部署至少两台才能把满血版跑起来,预算将近四百万。这对于规模较小或处于起步阶段的企业而言,有些吃亏。

但其实,并非所有人都需要满血版。

优刻得(UCloud)新兴产业事业部首席架构师李天朋观察到,现阶段许多用户是想把DeepSeek部署用在企业内部的智能问答场景中,预算三四十万的32B、70B等蒸馏版模型,已能满足需求,响应速度还会更快。他统计后发现, 最后实际交付时,满血版和蒸馏版模型比例大概五五开。

而对于什么样的用户需要满血版,他总结道:一类是对模型泛化能力要求高的客户,比如把DeepSeek用在对外服务上,面向大量用户;还有成本足够、希望在本地大规模部署的客户;以及希望借助DeepSeek模型优化内部算法来提升性能的客户,比如用来校准交易策略模型。

除此之外,大模型在业务里的“开疆扩土”,也可以交给满血版。云天励飞副总裁罗忆说道,开拓一个新业务时,要先让一位“老法师”把业务跑通,才能安排能力合适的下属在具体岗位上维系日常运转,同理,对业务闭环有高要求的用户,可以先用满血版把业务跑通,再安置不同的小尺寸模型在合适位置上。

3)训推一体机价格高昂,并非必要采购

而在引入大模型时,有传统企业用户希望训练自己的模型,于是摩拳擦掌看向训推一体机——其价格显著高于推理一体机。然而,在李天朋看来,这对大部分用户来说都不太必要。

他向雷峰网指出, 纯训练所占的资源至少是纯推理的两到三倍,但DeepSeek的颠覆性恰恰在于推理算力需求的大幅下降,这让训推的成本悬殊更大——

DeepSeek如果想跑训练,对底层硬件要求非常高,需要大显存和高容量存储系统等计算资源;然而,由于模型本身的高度稀疏性,在后续推理中,大规模储备的计算资源又会面临浪费。

并且,大部分用户真实使用时,训练周期相对推理周期非常短,早期的训练需求可以寻求算力厂商或云厂商租赁资源。除非是有行业知识的垂直领域客户——如医院、法律和金融行业——希望用RAG训练微调DeepSeek,对模型后期训练有更高要求,下重本选训推一体机会更划算。

4)落地场景纷繁,业务适配、技术运维有门槛

本次一体机的部署流程,深信服云计算BG AIC智能计算产品线总经理郜振锋总结到,用户一般先小规模采购一批设备部署私有化模型,配提示词问答和搭内部知识库系统,AI起步后,再考虑耦合到原来业务系统。

目前,DeepSeek直接接入WPS、企业助手或客服问答场景的频次最高。但在行业人士看来,普通企业或许没有必要花这么大成本去“维护”这些数据,加密存储和云服务的安全措施已能满足需求。

而真正对一体机采购有刚需的,首当其冲是军工院所。其次是高端制造业,比如苹果、华为的供应链,应用于生产流程优化、高精度的缺陷检测等——去到这类场所拜访时,手机和电脑的摄像头都得贴起来,离开时若发现贴的纸张有撕过的痕迹,设备就会被没收,其对安全性的高需求可见一斑。

政府也是此次部署的重要参与者,部分还会通过发函的形式先行先试。这波AI探索中,各部门几乎都站上了起跑线。有厂商与政府合作的项目正在被赶着交付,因为“内部业务都催着要用”。

目前在政府侧,智算一体机的主要用途之一是公文生成和政务服务,如政务审批、咨询场景。例如,深圳福田就已在DeepSeek政务大模型基础上,上线70名“数智员工”,缩短公文审核时间90%。而此前在信息领域已有积累的数据局和公安部门,需求相对更明确“激进”——例如,公安部门的DeepSeek部署已能应用在预警、接警等环节中,帮助完成警情分类,或风险防控、侦查打击等。

金融、医疗等行业也是更明确自己一体机需求的用户,有客户会一次性提十台八卡一体机。

金融在信息化领域一直走在前列、也有较多预算支持,在此次部署中占据很大比例。目前,金融接入大模型,更多用于对内管理提效;在涉及财务分析等数值计算场景,很多用户还不敢直接使用DeepSeek模型。火山引擎在交付时还发现,许多金融客户还会关注在智能体的应用开发上。

腾讯TCE产品专家丛磊也指出,银行等金融机构本身已有千卡规模算力,DeepSeek对算力的需求变小,这一技术迭代给银行带来的挑战是,怎么用原来跑训练集群的算力,创造更多好的推理场景。

而医疗上,一体机能辅助导诊、对接药物数据库、实现细粒度的专科诊断,或帮忙自动总结病历等。

至于能源、电力等领域,主要落地场景是用户的生产和安全管理。比如安全监控系统,以前单靠算法逐个预警,产生报警后又需相关人员逐个确认排查;但现在,大模型能进行全流程编排,自动生成作业报表,呈现所有环节的情况。并且,DeepSeek接入工控和质检系统时基本时延要求都在50ms以下,调取API的方式很难满足。

整体来说,对性能需求不高,但对数据安全或访问延迟敏感的场景用户,更适合一体机。此外,不以业务闭环为目标、更注重科研和技术探索的场景,如科研院校、创业公司和开发者,也是一体机的目标客群。

场景适配后,要真正驾驭一体机,还有一道不容忽视的门槛:技术资源。

此次部署热潮中,罗忆就发现,一大半咨询的用户在过去两年里,对大模型的运用仍停留在观望状态。

这导致一体机落地时可能水土不服:部署一体机确实是“小时级”工程,毕竟点亮服务器的动作,半天、甚至半小时就能完成。但在这之后,要跟企业自身OA系统对接,还要后续运维,尤其接入具体业务时,DeepSeek工程化能力越好、专家模型就越多,就更需要通过调优找到性价比最高的方式。很多企业一通咨询后,发现自己根本没有技术能力去维护,遂作罢。(一体机真实落地体验如何?欢迎添加作者微信Ericazhao23探讨分享经验)

接入大模型并非一朝一夕,当厂家没能掌握用户具体的业务逻辑,当用户本身的数据治理和业务梳理不够准确,DeepSeek一体机和业务的结合就会出现鸿沟。可以想象一体机是个新来的实习生,企业本身如果没有成体系的业务梳理,实习生又如何尽快上手?

也因此,在罗忆眼中,过去两年在大模型结合应用落地上已有探索的客户,可以称得上是“好客户”:除了前期的数据治理等工作,他们可能已为系统上线建立测试集;更彻底些,有的用户这次只是把之前部署的大模型,切换成DeepSeek。


厂商生存之道:爆发初期,寻求行业的差异化

一个多月爆发六十多家厂商的一体机赛道里,各家如何杀出重围?

一个大方向是,厂商们都重视提供软硬一体的解决方案,帮助客户落地到具体场景。例如火山引擎提供其机器学习平台给用户进行模型开发,也集成其应用构建产品,推动落地;神州数码旗下神州鲲泰在提供匹配不同客户需求的“全家桶式”一体机解决方案时,也结合企业自研的AI原生赋能平台,为用户从PaaS层提供模型选型、多种模型软件适配和调优等能力。

但具体到软硬件基因,不同类型厂商已天然有各自的优势。

云厂商做一体机,除了软件调优、模型管理等方面是强项, 还能给用户的DeepSeek适配提供“一条龙”服务 。罗忆便建议道,用户部署一体机前,先租用云厂商的算力资源测试,验证模型能接入业务闭环,再选择合适的部署方式。

但云厂商的硬件并非自有,对此,UCloud的做法,便是由专门的硬件团队与多家硬件供应商对接,再和模型算法开发团队探索硬件解决方案。供应商按交付需求提供个性化硬件后,UCloud再预装推理引擎、算力调度等功能。

反观硬件服务器厂商,在软件调优能力上可能不占优,但胜在硬件建设成本和国产化适配。并且,其早期在售卖信息中心服务器时积累下的用户, 在客群和硬件基因上之契合,使他们更可能一脉相承成为后续买家。

一些ERP厂商如用友、汉得信息等,在此次部署中,也能因其早期客情积累而吃香。

不过,许多从业者坦言,厂商虽出身不同,但目前一体机的技术差异并不大。

理论上,各家核心竞争力应是推理大模型的效率指标和性价比,例如每用户的首次响应时间、能跑多少并发、每个并发能处理的最大上下文是多少等。

但在一体机爆发初期,市场具体性能指标并不透明,真实数字也不太好看:据悉, 目前首次在本地加载DeepSeek满血版可能要四五十分钟,而DeepSeek-R1在线服务每个并发能处理的最大上下文可以达到128K,但线下私有化部署,量化版本基本只能达到16K。

新产品调优需宽容更多时间,目前谈技术指标为时尚早,厂商们着力寻找差异化的方向,一个是 谁更“轻”

市面上尤其大厂的产品,大多主打“全栈”。有行业人士透露,有的大厂一体机产品或需至少三台服务器来管理。也因此,谁更轻量化,给用户带来的成本负担就更小。浪潮云海起初推出的也是三四台部署方案,但观察到许多用户会先选择落地一台,“想节约资源,避免犯错”。百度智能云便提出,在私有化部署层面搭载昆仑芯P800的百舸、千帆、一见的一体机产品,可支持单机环境下一键部署DeepSeek R1/V3全系列模型。

而对于中小厂商, 目前各家厂商抓住的差异化,主要是在细分领域的行业认知

例如,通用一体机之外,云从科技还会融合自己在公安、政务领域的行业积累,以“一体机+Agent”的形式交付巡检一体机、智能制造一体机。

这是中小厂商的游击战策略:通用一体机领域,定制要求低,客户触达量高,硬件配置又高度同质化,多重buff叠加,价格战几乎是无可避免; 而研发一体机在垂域行业里的应用,让一体机搭载更多行业智能体,议价能力也会更强,未来甚至可能比通用的价格贵上几倍

有的厂商也会通过和生态伙伴合作,拓宽其在具体行业内的深入探索。大华股份智能产品负责人任成介绍道,公司深耕智慧物联领域,在推出Deepseek一体机后,收到来自全行业的广泛咨询,于是以“大华+伙伴”的形式将Deepseek与场景化行业业务结合:由大华提供算力资源+大模型能力底座,协同生态伙伴的Know-how专家服务和业务应用,打造专业场景下的大模型整体方案。深信服也和ISV深度合作,以其AICP算力平台作为承载,由厂商加上应用组件,形成整体交互方案。

完整的“AI物流业”,就此形成。(一体机生意对上下游还有何影响?欢迎添加作者微信Ericazhao23交流)

不过,多位从业者也指出,随着用户侧一体机部署规模增大,单机运维成本上升,用私有云统一运维是性价比更高的方式。许多一体机厂商也已在为此布局。

浪潮云海DeepSeek超融合一体机便搭载云智能体管理平台,定义AI应用智能体要素,让用户像运维虚拟机一样管理AI应用,帮助用户实现知识库高效构建,满足传统应用+智能体混合运维需求。

深信服团队虽然也早早完成对DeepSeek的适配,但为了让用户能利用原有超融合产品快速上线,他们主推的DeepSeek解决方案是:让用户在原有超融合上扩展一台GPU升级为智算平台,或通过深信服的托管云快速申请线上资源和服务,或用AI创新平台把DeepSeek结合进自己业务中。

放眼望去, 和云密不可分。

另外几家云大厂的Deepseek一体机也都在云产品线里,例如火山引擎的DeepSeek一体机由其内部混合云产品孵化,百度的解决方案则来源于百度智能云,还有阿里云、京东云等。

腾讯则没有推出一体机的硬件部署方案,仍以其专有云TCE和分布式云CDC的方式为客户提供本地部署服务。腾讯分布式云专家贾卷向雷峰网表示,市面常见的DeepSeek一体机形态与云的原生架构不一致,相比一体机形式,基于云架构的方案能覆盖更多客户场景,“DeepSeek出圈的速度非常快,很多业务团队考虑的是怎么尽快跑起来,但当业务扩大、需求丰富时,方案是否还能承载就未知了。”云服务能提供丰富的IaaS和PaaS形式的AI服务,更方便用户业务从单台、单机柜方案过渡到大集群的正式业务。

“一体机+云”的布局,在部分市场分析师眼中,也是更可持续增长的逻辑 ——云能提供灵活的计算资源分配,未来更可能成为Agent的载体。


一体机需求背后,市场的重资产基因

这波一体机的市场狂欢,也部分得益于此前市场给用户进行过的“预期管理”。

2023、24年,智算一体机也曾风靡市场,但彼时没有足够全民性的大模型,各家厂商的一体机价格昂贵,单台一体机动辄四五百万,且往往需要多台部署才能把大模型跑起来。成本之高,让企业望而却步。

相比之下,DeepSeek一体机的价格就显亲民,瞬间点燃市场热情。

不过市场是否有足够购买力,一个关键因素是,下游客户们的IT预算有无增长。大多数企业的IT预算在一体机市场爆发前已经规划好,ROI(投资回报率)尚不清楚的情况下,预算投入不会贸然增加。罗忆就发现,许多用户这次购置一体机的资金,其实是年前计划购买闭源大模型的资金。

整体上,政企客户的支付能力并没有变强,这也导致了,很多用户都想先拿样机去用,一体机在短时间内的回款可能卡壳。 (一体机是不是赚钱的生意?欢迎添加作者微信Ericazhao23讨论)

而随着一体机落地增多,其局限也逐渐展露。

首先,DeepSeek一体机孤军作战成果有限。除了要结合数据库等PaaS层产品,真正切入核心业务时,往往需结合领域专业模型使用。不同业务领域专业模型各异,这就决定了客户未来的需求是多模共存。

但, 目前市面上的大部分一体机,若想同时运行多个模型,可能存在性能问题。

而对于已有大模型的用户来说,是否需要切换DeepSeek也因场景而异。郜振锋提到,根据深信服自身以及与客户、行业ISV交流的经验总结,在需要大模型实现一定推理任务的场景里,切换到DeepSeek大参数模型后的效果优胜;但在一些相对通用的场景,如医疗导诊,仅是根据用户症状指引科室等工作,使用其他小参数量大模型,也能有不错效果。

其次,模型的迭代更新对硬件也是个挑战。

上层大模型持续更新时,有稳定后续服务的厂商,能帮企业在一体机上迭代。但从硬件现实上看,随着大模型发展,可能导致原有一体机算力资源不足。大华股份此次为客户交付DeepSeek大模型产品时,就发现许多中小型用户如果想跑满血版671B,都需要对现有机房中硬件进行大量升级改造。

而规模的扩展上,硬件部署也容易成其硬伤。

一台智算一体机一般被视为一个节点,然而,私有化部署进行高负载任务时,很难单节点作战。根据DeepSeek发表的论文,其推理系统采用跨节点的专家并行策略来实现高吞吐和低延迟,在大规模推理任务中,需要多个节点集群来优化性能。但AI一体机的架构,也容易局限其节点的扩展。

李天朋也表示,一体机并非最适合跑DeepSeek的载体。由于MoE模型的特性,一台显存足够大的一体机装上671B,每次每个token激活的计算只有37B,稀疏度很高,存在大量资源闲置。

由此,单纯堆砌一体机,带来的性能增长或许难成正比。对性能要求非常高的用户,或许需要自建计算集群。

云从科技的董秘杨桦观察到, 很多部署了一体机的用户感受就是降本增效了,“但如果说立马到了一个美好的人工智能时代,那好像也没有”。 但滤镜破碎后,真正的普及教育才刚刚开始。

而放眼整个市场,一体机也为部分“旧疾”带来新药方。

对ToB软件交付厂商而言,此前国内市场存在严重的项目定制化倾向,用户需求千差万别,企业一不小心就会成为客户的“外包”,导致所做项目难以推广、毛利不够。 而一体机形态的出现,让一些在软件方面有行业积淀的解决方案厂商,有了“软硬一体”、能复制推广的通用产品逻辑。

杨桦还发现,这种载体还让其部分需要硬件“安全感”的用户感到满足。这也符合市场国情: 中国市场向来重视重资产的投入 ——其作为企业的长期资产,本身具有一定账面价值,在经济下行时可以作为缓冲,也有助于提升企业市值,属于更长期主义的产品逻辑,在心理上能成为托底。

另一方面,这也让国产智算算力相关厂商,燃起信心。

此前,行业的核心痛点是跑国产卡。国产芯片受制于先进制程,单颗芯片的算力难以与英伟达等高端GPU相比,但通过C2C或D2D技术,这些小芯片能高速互联,形成类似大芯片的计算能力。尽管,国产算力和DeepSeek的适配上,还没能有效把算力和带宽的资源用足,但 DeepSeek在推理阶段的算力需求较低,至少已指明这类分布式芯片有承接大模型推理的能力。

此外, DeepSeek推理模型改变了对高额投入和高端算力的依赖,开源模型也让中小云厂有了帮客户部署大模型的新生意 ,这让在大云厂商缝隙中艰难生存的中小云厂,也有机会进入这个市场。尽管,毫无疑问,他们依然需要打游击战。

而在客户侧,借着这波一体机风潮,在Agent元年的开端,私有化部署的硬件设施得以加速走入用户侧。

在浪潮云海产品部总经理庞慷宇看来,一体机未来将会作为AI集群存在,用户再从私有云上调取PaaS和IaaS资源,以“大模型+智能体的方式”接入业务流。

可见,一体机更长远的未来,是Agent这片星辰大海。杨桦也相信,未来,软件市场会基于“开源DeepSeek+闭源模型”重塑,把应用都升级为Agent。

而这也是二级市场希望看到的:Agent在应用形态和场景上的更新。 有分析师指出,因为Agent极大可能诞生于国内大厂,因此,部分和大厂绑定的上市公司值得观望。此外,ERP公司的产品业务流程足够复杂,能涉及供应链管理、财务等,垂域行业Agent也更可能在这里发生。

AI Agent汽笛声远远传来,厂商狂奔而去。在此之前,一体机正在打下地基。

作者持续关注DeepSeek一体机市场需求、落地体验等情况,以及云计算及上下游相关,更多信息可添加作者微信Ericazhao23交流。


雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。

随意打赏

提交建议
微信扫一扫,分享给好友吧。