云大厂卖DeepSeek服务,不得不直面五大拷问

雷锋网  •  扫码分享

云大厂卖DeepSeek服务,不得不直面五大拷问

“一天十几个客户电话进来,有的一打一个多小时,我中午饭都没顾上吃。”云大厂政企销售小顾哑着嗓子告诉雷峰网,开源大模型DeepSeek出现后,市场反馈热烈,云大厂这边也接到不少客户来电,咨询相关的API接入和线下部署方案。

不过小顾坦言,DeepSeek眼下这么火爆,主要是因为它帮国人把大模型的信心又找回来了,但最终能转化成多少商业收益,能为云大厂带来多少拉动,还要打个问号。

究其原因在于,DeepSeek虽然降低了大模型的成本门槛,但它的能力跟ChatGPT差别不大,也面临和ChatGPT一样的困境:应用场景实在有限。

DeepSeek爆火后,作为产业链上的核心一环,云大厂们迅速跟进,手里的“战略牌”一张连着一张打了出来:组织变阵,业务调整,大笔投入,战略重构……整个一个目不暇接。

但随着这些市场动作的推进,一些问题也开始凸显,它们如同DeepSeek这波浪潮之下尖锐的礁石,直击云大厂们最紧张的神经。

面对DeepSeek引发的一体机热潮,跟还是不跟?

“几百个咨询里,能有一单成交就不错了。”眼下,手握DeepSeek一体机的云厂销售们正在经受着“冰火两重天”的煎熬。

DeepSeek的出现,大幅降低大模型推理门槛,对热衷于私有化部署的国内政企用户们来说,可谓正中下怀,于是便催生了DeepSeek一体机热潮。

然而,这一热潮是真正的价值机遇,还是昙花一现的浮躁之风,跟还是不跟?成为摆在云大厂面前的一道难题。

雷峰网通过调研了解到,眼下一众国内云大厂可分成两派:一派是推出DeepSeek一体机硬件部署方案的,有阿里、火山、华为、百度等;一派是没推出的,如腾讯云。

尽管大部分云大厂都推出了DeepSeek一体机,但实际上,一体机这一产品形态在落地应用时,还存在不少挑战,如客户业务扩展的灵活性、模型更迭的兼容性等问题。不少业内人也都向雷峰网表达了类似“DeepSeek一体机虽然眼下大热,但从中长期来看,可能是个伪需求。”的观点。

除了“光咨询不下单”外,还有不少政企客户,由于支付能力、采购流程等问题,会设法先把样机拿去用,而在回款进度上卡壳。

这些都让云大厂们不得不犹豫:如果大力投入,万一卖不出去砸手里怎么办?

不过某些云大厂对此自有一套对应之策。

多位业内人告诉雷峰网 (公众号:雷峰网) ,某云大厂的DeepSeek一体机测试样机大部分都全款卖给了OEM,OEM又卖给了集成商,层层转售下,对于云大厂来说,“卖不出去”的风险早已转移了出去。云大厂们在一体机上的花活不止这些,更多故事,可添加作者微信 xf123a 交流。

适配国产芯片,到底有多难?

“国货之光DeepSeek出现后,市场反应火爆,尤其是政府侧和金融侧的客户,然而对云大厂来说,想要回应这类客户的需求,并非易事。因为这两类客户都有信创指标,要在国产芯片上适配DeepSeek,目前还存在不少挑战。”政企IT老兵高荣坦言。

事实上,早在2022年,国资委79号文件就部署了国央企信创国产化的具体要求和推进时间表,要求到2027年央企国企100%完成信创替代,替换范围涵盖芯片、基础软件、操作系统、中间件等领域。

“DeepSeek本身是在英伟达H800 GPU集群上训练出来的,而且其AI Infra能力,尤其是软硬件协同优化能力,才是其性能强大的关键。如果用国产化芯片来适配DeepSeek,这里面会有很高的技术难度。”高荣补充道。

比如,国产芯片在算力密度和显存带宽上与英伟达GPU存在代际差距,这会导致适配DeepSeek后模型推理效率下降。

再比如,软件生态上,DeepSeek眼下的实践更多还是在英伟达CUDA生态内的优化,而国产芯片大多无法原生支持CUDA,需要通过兼容层或重新开发相应的工具链来实现适配,这增加了适配的难度和成本。

此外更让云大厂头疼的是,定制化噩梦似乎再次上演了:信创场景要求全栈自主可控,从芯片驱动到模型微调均需定制化开发,这背后的人力、财力、交付周期都不是小问题。

“政企需要私有化部署大模型,而且有很多行业术语和自己领域内的规则规范,都要对大模型微调后才能用,微调就是也要训练,满血版的价格不菲。”高荣告诉雷峰网,因为成本太高,眼下很多政企宣称率先用上了DeepSeek,其实十之八九都是之前买的AI算力没用完,正好闲置利用。

可以说,云大厂面临的这些困境折射出国内IT行业积弊已久的深层矛盾:市场需求倒逼技术跃进,但基础软硬件的代差仍需时间弥合。

DeepSeek掀起的这波热潮,看似把中国AI能力向前推进了一大步,但实际上,中国AI仍未摆脱英伟达芯片卡脖子的阴影,而这也为行业后续埋下了风险。

组织变阵:B、C融合还是B、C分离?

DeepSeek出现前后,云大厂们围绕大模型相关业务做出了两类组织变阵:一是B、C分离;二是B、C融合。前者以百度、阿里为代表;后者以腾讯、火山为代表。

去年下半年,百度将百度网盘(百度大模型核心应用场景之一)的C端业务从百度云(ACG)中拆分出来,重新划归移动生态事业群组(MEG),相关To B业务则继续留在百度云里,与百舸、千帆等其他百度云产品一道面向B端用户提供服务。

阿里这边类似。2024年底,阿里将AI应用“通义”从阿里云分拆出来,并入阿里智能信息事业群,与智能搜索产品“夸克”一起,由该事业群总裁吴嘉统管。而原有的通义实验室,以及大模型To B业务则继续留在阿里云。

不同于百度云、阿里云在大模型上业务上“B、C分离”的模式,腾讯云则是“反其道而行”。随着元宝调入腾讯云,腾讯云走起了“B、C融合”的路子。

今年1月腾讯,腾讯将元宝从技术工程事业群(TEG)调整至云与智慧产业事业群(CSIG),交由腾讯会议的负责人吴祖榕负责。并在不久后,将原本在PCG(平台与内容事业群)里的QQ浏览器、搜狗输入法、ima等产品也汇入CSIG,与元宝一起,作为腾讯面向大模型时代的产品组合。

至此,在这场DeepSeek冲击波到来之际,云巨头们纷纷摆好了阵型。不过在眼下这波瞬息万变、复杂难料的技术浪潮里,上述组织调整成效如何,以及会给各家带来哪些后续影响,还需持续校验。

云大厂扭亏为盈时间表,再度遥遥无期?

雷峰网此前从多位业内人处了解到,腾讯、华为两家云大厂原本计划在今明两年实现盈亏平衡,但现在,DeepSeek的出现打乱了他们的计划。关于各家云大厂更多盈亏内幕,可添加作者微信 xf123a 交流。

国内云大厂苦亏损久矣。目前只有阿里云实现了盈利。但对比其此前在云与AI上累计投入的数千亿元,眼下的盈利可谓牛九一毛。不仅如此,DeepSeek出现后不久,阿里就对外宣布,未来三年将向AI和云计算业务继续投入3800亿。这无疑为阿里云接下来的利润表现打上了一个问号。

腾讯云面临相似的难题。经过前些年的巨额投入后,集团内部对腾讯云“盈利,上岸”的呼声越来越高。不久前的集团年会上,马化腾也直言,过去一年腾讯云的表现超过他原本的要求,2025年腾讯云有望“浮出水面,形成一片大陆”。

但DeepSeek的到来,正在打破这一预期。今年1月,腾讯把C端大模型产品“元宝”从TEG(技术工程事业群)转入CSIG(腾讯云与产业事业群),进入做大增长阶段。随着元宝用户前端调用次数的增多,其后端算力资源的消耗也在攀升,腾讯云的盈利节点大概率要向后推移。

回望过去,云与AI因其基建属性,以及玩家之间的“内卷式”竞争,让绝大部分参与者都深陷亏损泥潭。如今,随着DeepSeek的崛起,云巨头们再次被推入新一轮的大模型基建竞赛里。上一轮未解决的盈利困境,能否在这一轮中找到更优解,仍是悬而未决的挑战。

DeepSeek成烧钱巨兽,何时是尽头?

DeepSeek走开源路线,本来为云大厂们提供了一次“当中间商,赚差价”的机会,但眼下,提供DeepSeek服务,对云大厂来说还是一门烧钱的生意。

DeepSeek推出后没多久,一系列有关成本的争论就冲上了科技圈热搜榜。有MaaS服务商甚至推算出了“接入DeepSeek R1,MaaS公司或将月亏4亿”的结论。

对于包括云厂商在内的,提供大模型服务的MaaS公司来说,一边是用户大批涌入,API调用量飙升,一边又是生成效率拉跨、价格战升级,多重夹击下,DeepSeek一度成为MaaS厂商们的“烧钱巨兽”。

DeepSeek公司之所以能把成本利润率做到545%之高,得益于其在模型架构、软硬件协同等AI Infra能力上能做到极致的工程化创新,使得其平均每台H800的吞吐量在生成任务上能达到14800 token/s,效率是市面上其他供应商的几倍甚至十几倍。

若不能做到这一点,则亏损难以避免。而眼下市面上,包括云大厂在内的MaaS供应商能做这一点的还寥寥无几。更多相关研发进展与内情,可添加作者微信 xf123a 交流。

因此,如果说在上一轮大模型浪潮中,各家云大厂还能安心做个稳赚不赔的“卖水人”,那么在这一轮由DeepSeek掀起的大模型普惠浪潮里,云大厂眼下难逃亏损。

而这场“烧钱大战”才刚刚开始。

回顾过去两年,国内云大厂在大模型业务上本已格局初定,但DeepSeek的异军突起,打破了这一平衡。DeepSeek不仅让各家互联网巨头的云业务估值迎来高光时刻,还让云计算从一项“老旧”业务重新焕发生机,在接下来的AI产业浪潮里,面对更多充满危与机的不确定性。

注:文中受访者均为化名。

雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。

随意打赏

提交建议
微信扫一扫,分享给好友吧。