2024 年的百度大模型,离「钱」越来越近

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

 

2024 年的百度大模型,离「钱」越来越近      大模型谈钱,不寒碜。

前些日子朱啸虎和杨植麟的隔空对话,代表了技术派和市场派的两种观点。朱啸虎不看好大模型 创业 ,认为现阶段大模型公司缺乏场景和数据,估值过高,且面临开源模型的竞争, 投资 风险大。他更倾向于投资能快速 商业 化、变现的应用层项目。

杨植麟坚定看好大模型创业,认为这是未来十年唯一有意义的事,并将其视为一个结合科学、工程和商业的系统,需要长期投入和坚持,最终目标是实现 AGl。

虽然两者观点看起来针锋相对,但有一点并不冲突,不论是在通向 AGI 的过程中 " 沿途下蛋 ",还是现在就投资能看到产出的大模型应用公司,今年大模型的商业化,一定是离钱越来越近。

若论国内对大模型商业化最热衷的企业,百度一定是其中之一。据此前报道,2024 年百度创始人李彦宏在百度智能云方向的 OKR 就是,跑通以大模型为核心智能云发展路径,并且在收入和利润方面都有要求。

百度智能云是百度 AI 能力的输出口,海外市场大模型与云服务结合得比国内更紧密,这也是百度智能云希望努力的方向。

3 月 21 日,百度智能云千帆大模型平台就一口气发布了 5 款新模型,包括 3 个轻量级大模型、2 个垂直场景大模型,并且千帆 ModelBuilder 以千帆 AppBuilder 也同步升级。钛 媒体 App 了解到,百度后续还将发布大模型应用产品,譬如销售、客服、办公等产品。

可以说,目前百度大模型商业化只有一条主线,让尽可能多的一部分人先用大模型,由此改变自己的产品和面向客户的服务。

大模型落地 " 值不值 "

初期大模型的火热,未必能转化为实实在在的订单,在大模型技术和产业的高速发展期,有些厂商已经被历史的车轮碾过,但却丝毫不起一丝波澜。

" 惨烈,我觉得是很惨烈,从去年到现在有很多基础模型厂商参与到市场竞争,也有很多的企业资金链受到了一些挑战,也反映出新技术发展过程中的一些矛盾。" 百度智能云 AI 与大数据平台总经理忻舟说道。

这其中一个很重要的因素,就是大模型供需之间的错位,大量企业没有掏出真金白银,而是处在观望阶段。从企业使用大模型的角度,主要关注三个因素,一是效果好不好,二是成本是否足够低,三是效率,因此多数企业并不关心大模型或者小模型,只会结合自己的预期评估大模型落地到自己的场景 " 值不值 "。

百度也提出了自己 " 效价比 " 的理念,除了极少的大客户对大模型有极致的效果追求,更多的企业和机构往往要综合考量大模型的使用效果、性能以及成本,即 " 效价比 "

2024 年的百度大模型,离「钱」越来越近 面向大模型如何落地,业内想了各种各样的技术方法,比如 RAG、插件、MoE、小型化、大小协同等等各种各样的问题,轻量级模型就是公认的 " 效价比 " 突出的方案。

" 业界也逐渐形成一个共识,模型不见得是参数规模越大越好。在很多实际的场景当中,用小尺寸的专家模型也能够达到我们通用大模型的效果,小尺寸专家模型的推理成本会更低,更便宜。" 百度副总裁谢广军表示。

他还提到,本次发布的三款模型都是开发专家模型的基座模型,主要面向两个场景:一是客户、合作伙伴结合自己的数据,去做垂类场景模型。二是百度也会基于这些小的基座模型,去开发第一方的行业垂类场景模型,比如做教育行业的教辅答题和解题,可以用一个小尺寸的模型加上一些数据,精调出一个效果很好的解题助手模型。

"3+2",5 款新模型

一月初,OpenAI 发布了多款新模型,价格下降,性能提升,百度本次也是同样的策略,百度智能云千帆 ModelBuilder 发布了包括 ERNIE Speed、ERNIE Lite、ERNIE Tiny 在内,参数量由大到小的三款轻量级大模型。千帆 ModelBuilder 的概念就是生产平台,提供整个模型训练的工具链,让模型开发变得更简单。

对于轻量级模型,谢广军表示,基座模型本身的效率一定要好,百度基于文心大模型的技术领先优势积累,再把尺寸做小,模型的效果就会做得很好,在很多场景它能够达到大模型的效果。

同时,百度发布的轻量级模型具备再生产能力,比如支持 post-pretrain、sft、lora 精调能力,基座模型加上精调数据来达到垂直场景下的效果,同时成本更低。

2024 年的百度大模型,离「钱」越来越近 具体来看,ERNIE Speed 在推理场景下拥有最高 128k 的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,同时,针对特定场景可以将 ERNIE Speed 作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。

ERNIE Lite 的参数量则更小,更适合搭载在低算力的 AI 加速卡上处理推理任务,作为 ERNIE-Bot-turbo 模型的升级版,ERNIE Lite 在情感分析、多任务学习、自然推理等场景下的应用效果提升了 20%,推理调用成本大幅下降了 53%。

参数量最小的 ERNIE Tiny 则主打极致低成本、低延迟,可用于检索、推荐、意图识别等高并发、低延时等应用场景中,在某对话推荐业务场景中,精调后的 ERNIE Tiny 在搜索引擎推荐词激发环节,相比 ERNIE 3.5,对话轮次增长了 3.5%,成本下降了 32%。

此外,百度智能云千帆 ModelBuilder 还推出了 ERNIE Character 和 ERNIE Functions 两款垂直场景大模型,分别适配客户在角色扮演类应用场景(如 游戏 NPC、客服对话等)和工具调用场景(对话中使用外部工具、调用业务函数等)中的使用需求。

结合企业实际使用大模型的过程,有些企业起初就用最好的模型看最好的效果,再决定投入的资源程度。有些场景需要快速验证,企业可以先上轻量级模型,轻量级模型总结一句话—— " 轻归轻,可破冰 ",在一些场景下完全可用,作为大模型落地的先锋军。

对于注重私有数据的企业和行业,私有数据跟大模型结合也可以先用轻量级模型,不管是知识资产还是数据分析,都可以跑出效果。

" 把大模型应用,喂到企业嘴边 "

千帆大模型平台上的客户需求主要分为三种,第一类是在 AppBuilder 开发应用;第二类,直接调用百度的基座模型的,比如直接调用文心 4.0、 3.5 版本;第三类是生产模型,客户数据和百度基座模型结合做一个新的垂类模型。

AppBuilder 去年年底推出,从应用的视角让开发者能够便捷地开发基于大模型的 AI 原生应用,百度第一方也做了非常多的 AI 原生应用,也是基于这套平台做的,本次 AppBuilder 也进一步升级,进一步降低应用开发门槛。

升级后的 AppBuilder 开放的工具组件多达 55 个,包括基于百度多年技术积累和自有业务沉淀的大模型组件、AI 能力组件,也包括搜索等百度特色的业务组件、和多场景的第三方 API 工具,另外还提供了 RAG(知识检索问答)、GBI(生成式数据分析)等根据典型应用场景深入调优的高级能力组件。

在组件之上,千帆 AppBuilder 推出的 Agent(智能体)应用框架,具备精准的任务自主规划能力,对多种应用工具的自动编排准确率超过 90%。AppBuilder 还支持开发者接入自定义工具,实现更复杂场景应用的需求定制。

谢广军介绍,AppBuilder 分两个形态,一个是代码态,百度提供 SDK,甚至提供底层的组件和能力,这种是大 B 端的场景下的典型客户画像。另一个是零代码态,以小企业、个人开发者为主,现在零代码态开发者的数量比较多,百度这两条路都要走。

根据百度智能云公布的数据,千帆大模型平台已经服务 8 万企业用户,累计帮助用户精调 1.3 万个大模型,帮助用户开发出 16 万个大模型应用,自 2023 年 12 月以来百度智能云千帆大模型平台 API 日调用量环比增长 97%

大模型未来一段时间还会不断快速演进,百度 AI 团队主抓基础模型,智能云团队主抓商业落地,构成了百度自己的大模型商业落地模式。

来源:钛媒体

随意打赏

提交建议
微信扫一扫,分享给好友吧。