做不出 GPT,字节云曲线救国

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

 

做不出 GPT,字节云曲线救国

" 大语言模型改变云计算 游戏 规则 ",李彦宏的这则断言,愈发成为云计算行业的共识。

可以从两方面来解释这种新变化。一方面,大语言模型在训练和推理过程中需要大量的计算资源,即算力。而这些需求催生了云计算厂商为模型训练提供更强大、更高效的计算资源。

作为佐证, 投资 机构 A16Z 认为,生成式 AI 市场里的大量资金,其实最终流向了基础设施公司。

A16Z 估计,应用公司平均将约 20%-40% 的年收入,用于推理和定制化的微调。这部分通常直接支付给云服务提供商,以获取实例或支付给第三方模型提供商,而后者将大约一半的收入投入于云基础设施。据此有理由推测,生成式 AI 总营收的 10%-20% 将流向云服务提供商。

不仅如此,A16Z 估算,许多拥有自家模型的初创公司已筹集到数十亿美元的风险投资,其中大部分资金(在早期阶段高达 80%-90%),通常会支付给云服务提供商。这可是流向云厂商的 " 一大笔钱 "。

另一方面,大语言模型的兴起,让许多复杂任务可以通过预训练模型来解决。企业无需拥有庞大的技术团队和资源,就能利用云计算服务快速实现 AI 应用。

简单来说,模型即服务(Model as a Service,MaaS)将成为新的云计算服务形式。企业可以通过 API 调用预训练模型来满足自身业务需求,而这降低了云计算服务的使用门槛。

微软是最典型的案例。眼下,Azure OpenAI 服务已经普遍可用,企业可以申请访问包括 GPT-3.5、Codex 和 DALLE 2 在内的人工智能模型。目前,已经使用 Azure OpenAI 的客户有半导电视台、毕马威、RPA 厂商 Moveworks 等等。

得益于上述新变化,国内云计算行业迎来新的发展契机和活力,特别是在如今的低增长速度背景下,更加鼓舞人心。

此前,市场研究机构 IDC 在 2022 年底的预测报告中,将中国云计算行业未来五年的平均增长速度下调了 10%。这是考虑到 互联网 行业整体增速放缓的影响,同时政企集成业务也在调整过程中。多方因素共同导致了互联网云厂商普遍降低了业务预期。

从这个角度出发,便能理解为何众多云服务厂商,如此热衷于成为国内大模型热潮中的舵手。

" 卖铲子 " 的火山引擎

当前,大模型成为 科技 领域最热门的话题。在中国,至少有数十家企业和机构已经发布了大模型产品或公布了相关计划。作为互联网领域的翘楚,字节跳动自然不会缺席这场 AI 竞赛。

据《晚点 LatePost》报道,面对 ChatGPT 和背后的大模型机会,张一鸣选择亲自跟进。一位字节人士称,张一鸣近期时常会和一些字节人士分享论文学习心得和对 ChatGPT 的思考。

据了解,字节今年初才开始组建专门的大模型团队,但一把手的跟进也意味着诸多资源倾斜。果不其然,近日,在 BAT 先后展示自己在大模型产品领域的进展后,字节终于亮出了自己手中 " 另类 " 的牌。

字节跳动旗下云服务平台火山引擎举办的 " 原动力大会 " 上,火山引擎总裁谭待表示,火山引擎不做大模型,而是服务客户做好大模型,为企业和消费者提供更丰富的 AI 应用。

进一步解读,眼下国内很多科技公司投入到大模型建设中,火山引擎要做的就是为大模型客户提供高稳定性和高性价比的 AI 基础设施。

曾经的北美淘金热时期,寻找黄金的人们需要购买铲子等必备工具,而出售这些商品的商人赚取了可观的利润。在现代 商业 环境中," 卖铲子 " 这一说法常常用于形容为他人提供工具、服务或基础设施的公司,而非直接参与某个行业的竞争。火山引擎此次想做的便是在大模型热潮中 " 卖铲子 "。

后续的宣传环节中,有两个噱头十分玩味。一是,火山引擎宣称,中国的大模型领域,七成以上已是其客户。面对 媒体 群访,谭待解释道,上述 " 七成 " 是火山引擎相关客户与第三方机构统计的大模型企业数量之比,能获得这么多客户是因为机器学习平台解决了算力辅助的问题。

二是,为了让更多潜在客户安心,谭待在多个场合公开表示,火山引擎不做大模型。" 我们不急于推出一个只有 30 分且只能适用于本地部署的大模型,这不是最关键的,核心是赋能其他人做这件事情。"

这几乎是公然叫嚣其他大模型参与者,特别是前不久刚刚放言 " 不用造轮子 " 的云厂商们。

拿阿里云来说,此前的云峰会上宣传口径是,阿里云希望帮助更多企业用上大模型,让每家企业都能基于 " 通义千问 ",拥有具备自己行业能力的专属大模型。换句话说,在阿里巴巴提供的算力基础设施、机器学习平台以及大模型服务的支持下,企业们不再需要浪费时间和精力去 " 造轮子 ",或是陷入针对大模型通用能力的无谓竞争。

百度也是同道中人。李彦宏认为自家三月发布的文心一言距离 GPT 的差距大概在两个月,并且认为国内大模型 创业 已经基本没有机会,大家也没必要在大模型上重复造轮子。为此,还引发了王小川的揶揄。

在阿里、百度先后公布大模型策略后,火山引擎拿出更低的姿态,显然是在丢掉时机优势后,寄希望于弯道超车。毕竟,哪个创业者没有成为中国 OpenAI 的梦呢?

字节云需要更多王小川

" 卖铲子 " 商业模式的核心,是鼓吹更多淘金者加入。

历史上,加州淘金热期间,当地报纸发表了关于在若干地点发现金子的文章,迅速引发了广泛的关注。一些商人和企业便利用淘金热来推广他们的产品和服务。例如,邮轮公司和铁路公司为了吸引更多的乘客,大肆宣传推销前往淘金地区的船票和车票。

放到此次大模型热潮中,火山引擎想要靠 " 卖铲子 " 发家致富,自然需要站在 " 王小川们 " 这一边。

为此,火山引擎造了 " 多云多模态 " 这个概念。谭待表示,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对 AI 算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。" 未来将是‘多云多模型’的时代。"

对于该论断,王慧文(美团联合创始人)、贾扬清(原阿里技术副总裁)、周伯文(原京东高级副总裁)、李岩(快手前 MMU 负责人)、闫俊杰(原商汤科技副总裁)等创业者肯定赞同。

不过,这里也还有一些不确定因素。其一,王小川等创业者一定会用火山引擎卖的 " 铲子 " 吗?

简单来说,火山引擎主要是为大模型客户提供 AI 基础设施,可以理解为 AI 算力需求。而对于算力需求,王小川并没有直言通过云厂商来满足。

此前在参访中,王小川认为中国可以购买的英伟达 A800 和 A100 芯片性能差距只有 5%,目前不会成为 " 卡脖子 " 的瓶颈,尤其对未来国产芯片有一定技术突破特别有信心。

简单来说,对于王小川等创业者而言,是否 " 借道 " 云厂商们犹未可知。

其二,火山引擎是否会坚守不涉及大模型的立场?

据《晚点 LatePost》披露,目前参与字节大模型的技术负责人有朱文佳、项亮、李航等,他们分属字节多个部门。其中项亮、李航向火山引擎 BU 负责人杨震原汇报。

对于要不要做大模型,杨震源曾回应称字节跳动对大模型也在做一些学习和研究,现在还没有什么结果,也没有大模型产品落地时间表。从这里来看,火山引擎并没有宣传中那样坚定路线。毕竟不做大模型,直接意味着云厂商少了模型及服务这条营收支线。

从这次整个宣传动作来看,火山引擎延续了一直以来的策略。此前,作为云市场的后来者,火山引擎的目标是做阿里云、腾讯云、华为云之外的 " 第四朵云 "。

对此,多云成为火山引擎反复强调的一个宣传点。RightScale 在 2019 年对全球企业用云策略的调查显示,超过 1000 人的大型企业中,选择多云部署的占比达到 84%,其中混合云占比达到 58%。这种多云策略,或是字节跳动扩大市场份额的转机。

而这次,火山引擎在多云的基础上还加上了多模态。

不过,根据 IDC 最近发布的《中国公有云服务市场(2022 上半年)跟踪报告》显示,2022 年上半年,阿里云、华为云、天翼云、腾讯云和 AWS 这五大云厂商一直占据了 70% 以上的市场份额。火山引擎仍然处于名不见经传的其他厂商(Others)之列。

显然,在这个已经相对成熟的云市场中,火山引擎想要突围并不容易。后发者想要颠覆格局,天时地利人和缺一不可,大模型热潮可以看作机会窗口打开,但结局到底如何还要取决于字节团队的深耕细作。

来源:科技新知

随意打赏

提交建议
微信扫一扫,分享给好友吧。