DeepSeek 引爆国产适配的前夜,「硅基流动」已完成亿元融资
有人预料到 DeepSeek 能引爆全球吗?至少,DeepSeek-V3 发布前,在大模型战场前线 " 卖铲子 " 的袁进辉心里也是打鼓的。
1 月 28 日,他在 社交 媒体 上回忆起一个故事:DeepSeek 爆火前一个月,梁文锋曾建议硅基流动部署 DeepSeek-V3,至少准备 20 台 H800,80 台最好。袁进辉迅速算了算账,一个月 80 台 H800 服务器就要支出五六百万的算力成本,这些机器还不一定能用满。" 风险太大了,就没下注。"
随后 DeepSeek 火爆全球,汹涌的流量让其官网和 App 很快崩溃,热情的用户急于找到能正常使用 DeepSeek 的渠道。袁进辉感慨:" 现在 DeepSeek 这么火,决策失误,欲哭无泪。"
很快,这种懊悔转变成强大的行动力。苦于算力不足的硅基流动找到华为,全力完成 DeepSeek-R1 & V3 在昇腾芯片上的适配工作。整个春节期间,硅基流动团队没有休息过一天。
他们的动作够快,承接住了第一波流量。2 月 1 日,硅基流动首发了基于华为昇腾算力的满血版 DeepSeek-R1 & V3,迅速吸引了大批开发者和个人用户。
△图源:SimilarWeb
这是一次巧妙的合作,一举扫清市场对于国产芯片性能瓶颈的疑虑,证明了在国产芯片上部署 DeepSeek,也可以获得持平全球高端 GPU 部署模型的效果。同时,这次合作无意间触发了一场国产替代的狂欢。
硅基流动也借此证明了自己的 AI Infra 实力。" 尤其这次上线 DeepSeek R1 & V3 之后,涌过来的合作线索,暂时都看不过来。" 袁进辉说。
就在硅基流动爆火之前, 《智能涌现》获悉,硅基流动(SiliconFlow) 在 2024 年底 就已完成亿元人民币 Pre-A 轮融资,由华创资本领投,普华资本跟投,老股东耀途资本继续超额跟投,华兴资本担任独家财务顾问 。
值得注意的是,本轮融资之前,硅基流动已引入美团作为战略股东。
2024 年 8 月,《智能涌现》曾采访过创始人袁进辉,当时硅基流动正好成立一周年,刚发布 MaaS 平台 SiliconCloud。
你可以将 SiliconCloud 想象为一个 " 大模型 API 超市 ",开发者只需要注册账号,选择自己想要的模型,就可以开发应用,免去购买服务器的负担。甚至,经过硅基流动适配和优化后的模型,还能做到比原厂模型响应更快、推理成本更低。
在这一年间,硅基流动经历了起码十倍的市场增长。SiliconCloud 已经获得了超三百万的用户,日均调用上千亿 Token ——去年刚上线时,这个数字还是日均百亿。
△图源:硅基流动
在开发者圈子中,硅基流动有着良好的口碑,因提供亲民价格和优异性能的模型服务被称为 " 赛博菩萨 "。现在,SiliconCloud 已经上线了包括满血版 DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice 等在内的上百款主流模型,也提供模型训练、微调、托管到部署的全套工具,满足开发者及企业客户的不同应用场景需求。
2024 年 7 月,硅基流动也推出了一款新产品:基于 ComfyUI 的云节点插件 BizyAir。
BizyAir 是一款图像生成工具,能够让 AI 开发者与创作者无需考虑显卡和环境限制,即可直接使用云计算资源完成生图任务。截至目前,BizyAir 支持数十种模型,支持 ComfyUI 本地节点混跑,已经获得了近万名用户。
硅基流动在这一年间也开始了 To B
商业
化扩展,与华为、亚马逊云
科技
、英伟达等顶级云厂商、芯片厂商、大模型公司及应用公司建立了合作伙伴关系。
企业服务方面,硅基流动已经在大语言模型、文生图、视频生成等多个场景,有标杆客户案例的落地。硅基流动目前提供四种服务模式,包括专属实例、算力纳管、私有版 MaaS、基于华为昇腾 910 系列 NPU 的一体机。
毫无疑问,DeepSeek 已经一扫 2024 年大模型领域的阴霾,一场宏大征程的序幕已经展开。2024 年,袁进辉曾对《智能涌现》表示,在 GPT-4o 出来后,大模型的语言能力、知识能力方面的限制都解决得比较好了,除了逻辑推理能力。
OpenAI o1、DeepSeek R1 的出现,意味着大模型在 " 逻辑能力 " 这个问题上前进了一大步,这对应用市场是巨大利好。
" 可以预期,国内外基于 DeepSeek 的应用将爆发,这一天终于要到来了。" 袁进辉说。
以下为《智能涌现》与创始人袁进辉的问答:
《智能涌现》 :上一轮融资之后,硅基流动在产品方面有什么节点性的进展?关键性能提升的程度如何?
袁进辉 :主要是适配了华为昇腾芯片、开源了 ComfyUI 云节点 BizyAir,以及持续上线最新模型,并且上线了模型微调、托管等功能。
底层推理框架的性能依然保持业内领先,性能优化是一项需要长期、持续性投入的工作。
《智能涌现》 :推出相关产品后,市场都有怎样的反馈?商业落地上有什么关键性进展?
袁进辉 :SiliconCloud 获得了爆发式增长,目前平台有超三百万用户,日均调用超千亿 Token;BizyAir 在没做什么推广的情况下获得了近万名用户。
商业落地方面,尤其这次上线 DeepSeek R1 & V3 之后,涌过来的合作线索暂时都看不过来。
《智能涌现》 :去年 7 月硅基流动上线了 BizyAir,为什么会推出这个产品?战略定位是什么?
袁进辉 :BizyAir 是一个意外惊喜。起初,这是一个试验性项目,其实还是帮助用户用高性价比的推理服务资源,更方便地进行生图。在 BizyAir 之前,我们开源的图片 / 视频生成推理加速组件 OneDiff,由于性能好、灵活、支持模型丰富,已经有较好的口碑。在做 OneDiff 的过程中,我们了解到生图用户的常见痛点,包括出图慢、工作流组合繁琐、上手门槛高等,所以我们尝试开发了 BizyAir,发布后受到了不少用户的喜爱以及自发传播。
《智能涌现》 :去年你说,大模型的语言能力、知识能力方面的限制都解决得比较好了,除了逻辑。Deepseek V3 之后,是不是逻辑能力也做得足够好了,2025 年会迎来现象级的应用吗?
袁进辉 :那时还没有 OpenAI o1、DeepSeek-R1。它们的发布已经展示出模型的强大逻辑推理能力,并且 DeepSeek-R1 把思考过程完整地展示了出来,看上去更像是一个有思辨能力的人在思考。
现在,开发者基于标准 API 可以做很多很酷的应用了,可以预期,国内外基于 DeepSeek 这样的开源模型的应用将爆发,这一天终于要到来了。
《智能涌现》 :最近硅基流动迅速基于昇腾上线了 DeepSeek,春节期间也有大量开发者涌入,你们在前线看到的情况是怎么样的?
袁进辉 :我原本以为我们能接住这波用户,但市场对 DeepSeek-R1 & V3 的需求量太大了,目前不得不对免费用户进行限流,当然,我们也在积极扩展资源,希望能让用户敞开用。
我们作为一个面向开发者与企业客户的 API 平台,但是光官网的 Playground 就有几十万日活,可见 DeepSeek 需求量之大。
《智能涌现》 :很多第三方企业宣布接入 DeepSeek-R1 & V3 ,但为什么实际能提供满血版的企业很少?
袁进辉 :一方面,部署满血版 DeepSeek R1 & V3 需要的算力资源非常大,用 80 台 H800 来部署,每月需要五六百万的算力成本,一般企业与其自己本地部署,显然接入硅基流动 SiliconCloud 这样的云服务 API 更划算;
另一方面,要部署 DeepSeek R1 & V3 这样的 MoE 模型技术挑战很大,需要专业的 AI Infra 团队才能部署成功且把性能优化得很好,硅基流动 SiliconCloud 曾是国内最早部署上线 DeepSeek 模型的第三方平台,也是首个在国产芯片上适配部署 DeepSeek-R1 & V3 的 AI Infra 公司。
来源:36氪