历史转折中的百度

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

 

历史转折中的百度

大风始于青萍之末,命运的偶然和必然经常会纵横交织在一起。

2019 年,是整个人工智能历史上,最为晦暗的一年。继 2016 年 AlphaGo 打败李世石,2017 年 Tansformer 架构横空出世使得技术大规模爆发,2018 年的 创业 热潮之后。2019 年,资本退潮、技术瓶颈期、场景难落地,开启了人工智能史上的 " 乱纪元 "。

没有人知道通用人工智能何时到来,就像三体人不知道太阳会在何时升起。

那一年,大批 AI 公司陷入裁员风波、资金链断裂、产品难产,能坚持至今的,所剩寥寥。

但也正是在 2019 年,AI 新的希望开始孕育:OpenAI 在 7 月接受了微软的 投资 并与其深度合作,如今让世人震惊的 GPT-3 正是从那一年开始研发;国内最早树立 AI 战略的百度,从年初就开始进行了一次长达半年的人事调整,如今看来,重新排兵布阵,似乎是开启了长达 4 年的坚守期。

2019 年,王海峰晋升为集团 CTO,继续担任 AI 技术平台体系(AIG)和基础技术体系(TG)总负责人,两者是百度最重要的技术底座;沈抖晋升为高级副总裁,全面负责移动生态事业群,随后在 2022 年又调任至百度智能云,成为百度第二增长曲线的开拓者;而在 2019 年引进的一批新生力量中,何俊杰是唯一一名 80 后百度副总裁,先是负责投资并购和战略投资,后又被重用,负责沈抖空缺出来的移动生态事业群,实权更加在握。

时间来到了 2023 年,Transformer 的能力在这一年终于由 OpenAI 打破了天花板,进阶到一个新的层次,技术的突破让 OpenAI 一举成为全世界最受瞩目的公司。微软盖过了谷歌的 科技 光辉。

在过去四年里,百度的核心业务形成了由沈抖领军智能云,何俊杰负责移动生态,王海峰压阵技术的三角结构,百度也终于结束了静默期,开始转守为攻,动作不断。

" 重新把每个应用都做一遍 ",是经历了半年蓄力后的第一次亮剑,如今的百度像一颗行星,即将遇到巨大的 " 技术引力场 ",而彻底改变轨道。

大模型涌现前夜

2017 年,谷歌在一篇名为《Attention Is All You Need》的论文中,提出了 Transformer 架构,以替代传统的 RNN 和 CNN 循环模型,论文中展示了 Transformer 的训练准确性高于之前所有模型,训练时间明显低于之前的模型,在训练集内容较少时训练效果也很好。

这之后,Transformer 架构迅速被接受并应用在了 NLP 和 CV 领域,尤其在 NLP 领域,注意力机制让机器能够更准确地理解语义并生成,以及减少信息重复。

作为最早一批发现并跟进 Transformer 技术路线的公司,百度已经在 NLP 领域研究超过十年之久,并已经组成了一支由王海峰、吴甜、吴华等顶尖专家组建起来的精悍的 NLP 队伍。

彼时,NLP 团队成立的第一个重要任务,是打造百度翻译。王海峰将深度学习和神经网络大胆应用在翻译中,加强机器对上下文的理解,形成更流畅的译文。这一勇敢尝试也让百度翻译成为第一个支持 200 多种语种的翻译系统,甚至比 Google 还早了一年零 3 个月。

这也是大模型四大核心能力 " 理解、生成、逻辑、记忆 " 中,理解能力的雏形。

但王海峰觉得,NLP 还不够。他专门跑到李彦宏办公室去做汇报,提出了下个 " 登陆的诺曼底 " ——语音识别。他的理由是,语音识别技术马上要到产业化的临界点,一旦突破很快就会大规模商用。

李彦宏凭借着自己对技术的判断,决定再次支持王海峰,陆续建立了与 NLP 部门平行的 " 语音识别部门 "、" 图像识别部门 " 和 " 知识图谱部门 "。

王海峰的一通操作让很多百度的同学不解," 这些技术和百度现在的产品也没关系啊,一股脑创建这么多部门,是攒着过年么?"

彼时的王海峰,正是看到了搜索数据对于大模型形成逻辑有着非常强大的支撑。  " 百度有世界上最大的搜索引擎,搜索引擎不仅信息时效性很强,也有很高的准确率,可以构建最全的知识图谱 ",王海峰曾在公开采访中解释道。

在打造文心一言之前,百度沉淀了拥有超过 50 亿实体、550 亿事实的多元异构超大规模的知识图谱,能够通过语言、听觉、视觉等获得对世界的统一认知。其在 2021 年发布的知识增强大模型—— ERNIE ( 文心 ) 3.0,正是文心一言的前身,该项目由吴甜主要负责。

又是 2019 年,百度文心 1.0 发布,在 4 年时间里迭代了 3 个版本。2022 年 11 月,吴甜在公开峰会中同时公布了文心已经累计的 11 个行业大模型,涵盖电力、燃气、 金融 、航天等领域,产业生态初步形成。

这些,都为百度抢先发布文心一言做了伏笔和铺垫。3 月 16 日,文心一言发布之后,百度再次回到镁光灯下,但比肯定更多的,是质疑。

" 市场需求这么旺盛情况下,谁先做出来还是意义非常大的 ",李彦宏曾在采访里讲到,即便产品并未完全成熟,但仍然要发布的原因:" 文心一言发布之后,无数的人,过去不怎么联系或者行业跟我隔得很远的人都在问,我们怎么能跟百度合作,怎么尽早试用 "。

从技术的角度,大模型更是 " 越用越灵 " 的高速迭代。  " 内测的时候,员工问,文心一言怎么藏头诗写不好?我说等等吧,明后天估计就能学会了,结果第二天果然就能用了,大模型的进步也是一个不断学习的过程 ",王海峰笑道。

在半年时间里,文心一言从 3.0 到 3.5,再到 4.0 版本进行了三次迭代,据王海峰在会上介绍,文心一言用户规模已经达到 4500 万,开发者 5.4 万、场景 4300 个、应用 825 个、插件超过 500 个。

在 NLP 浇的水,施的肥,终于在 2023 年迎来了丰收,也正如李彦宏所讲,技术发展的路径,是 " 一生二、二生三、三生万物 " 的过程。

大模型背后的内功

通用人工智能爆发之后,云计算的关注度和企业重视程度到了顶峰,也随即来到了 "iPhone 时刻 "。

大模型的出现,产生了巨大的算力缺口,云计算既为大模型提供云算力支撑,又是大模型落地企业的最佳着落点,无论是百度还是任何一家拥有大模型的企业,当大模型面世,下一步的重点便是推向市场,让企业用起来。

对于百度而言,这样的重担,落在了沈抖肩上。

在百度的六大事业群负责人中,除了 CTO 王海峰,沈抖是唯一一个高级副总裁。虽然同为技术出身,但和王海峰的 " 工程师 " 角色不同,沈抖从加入百度开始,就一直在负责关键业务的增长。

加入百度的 10 年里,沈抖先后整合了广告投放系统,提高了系统变现能力;将搜索和 feed 信息流进行结合;整合了由搜索升级后的移动生态事业群,补齐了百度移动生态的版图。

如果说,王海峰打造了一把尖刀,那沈抖则是能利用这把尖刀,开拓疆土的先锋官,用李彦宏的话说是 " 敢打硬仗、能打胜仗 "。

2022 年 5 月,沈抖轮岗为百度智能云(ACG)事业群总裁。于百度而言,最开始并没有全力押注云计算,但也正是随着人工智能技术的不断发展,让百度意识到了云计算短板后,开始暗自发力,默默培养第二增长曲线。

由于没有先发优势,百度云过去 10 年的目标都十分明确,不和 " 老炮 " 们比拼 IaaS 层的规模化,而是通过 PaaS+SaaS 与智能化能力的结合,打出差异化,并以小搏大地切入企业数字化。

2023 百度世界大会上中,沈抖再次提出 " 云智一体 " 战略:" 人工智能与云计算的深度结合是企业快速落地 AI 原生应用的关键。目前,百度集团所有应用和服务全部基于‘云智一体’技术架构运行在百度智能云上 "。

据光锥智能观察,云智一体战略的核心在于,一方面,以百度智能云为依托,可以快速为企业提供整套的大模型服务;另一方面,大模型也推动着企业数字化的门槛变得更低。

在接手 ACG 后的 5 个月里,沈抖针对企业在大模型时代的核心需求,迅速整合出了 " 大模型服务超级工厂 " ——文心千帆,并按需求将用户分为五大类用户。

首先,针对算力资源所产生的需求缺口,  千帆平台提供各类异构算力。比如在耗费最多训练环节,通过分布式并行训练和微秒级互联能力,千帆平台可以实现万卡集群训练加速比达到 95%,有效训练时间占比达到 96%,大幅降低客户算力和时间成本。

其次在模型层面,  对于希望直接调用已有大模型的客户,企业可快速调用包括文心一言在内的多个大模型,同时千帆平台提供中文增强、性能增强、上下文增强等工具。据沈抖透露,目前千帆平台已经服务超过 1 万 7 千家客户。

针对有二次开发需求的客户,  千帆平台为大模型提供再训练、微调、评估和部署等全生命周期工具链,业界最多的 41 个高质量行业数据集,并针对自身业务场景快速优化。

大会现场还进行了如何基于检索增强生成(RAG,Retrieval Augmented Generation)框架,为三一重工快速开发知识问答应用的实操演示:只需在千帆 AI 原生应用工作台中选择预置的 RAG 框架,进行相应的参数配置等工作,就可以快速实现三一重工官网智能客服应用的开发与上线。

沈抖表示,搭建这样一个 " 小助手 ",即使需要处理几千篇万字长文档,成本也只需几百块钱;而之后用户每次咨询,成本仅需几分钱。

一直以来,大型工业、制造业、农业都是数字化的深水区,核心原因就在于产业的复杂性导致了数字化的门槛高,难以落地。

但通过大模型,既降低了使用门槛,也降低了使用成本。不需要打造任何新系统,也不需要人工参与,是技术组件的一个更高级的应用方式,  二者结合,也转起了云智一体的飞轮,逐步蓄力。

大模型的创新挑战

过去已成定局,未来却可以改变。

所有拥有了大模型的厂商,都发现了应用层的机会。微软在 3 月份就开始动刀包括 Bing、Office、Windows 系统在内的全线产品,阿里张勇讲道:" 要用大模型把所有产品重做一遍 ",然而这句话,说起来简单,做起来却是大模型时代最大的创新挑战。

AI 如何重构应用?这不仅要业务能力,更需要想象力,面对一个新的 AI 时代,百度也将指挥棒交到了年轻人手里。

2022 年 5 月之后,接替沈抖作为 MEG 事业群负责人的,是百度人才梯队建设计划中引入的 80 后副总裁——何俊杰。如果说沈抖是 " 硬战派 ",那何俊杰就是名副其实的 " 少壮派 "。正如任正非所说,要 " 让听到炮声的人指挥战斗 "。

重构应用,是不破不立,对比来看,百度对自己,确实 " 下手特别狠 "。

百度世界大会,围绕 " 生态 ",何俊杰交出了 " 移动生态 "、" 内容生态 " 和 " 商业 生态 " 的答卷。

其中,移动生态涵盖了 " 新搜索 "、" 新文库 "、文心一言 APP、百度电商 " 慧播星 " 等 AI 原生应用;内容生态层面,通过百度 APP"AI 编辑器 " 等一系列应用为创作者生态赋能;商业生态层面,推出 AI Native 营销 平台 " 轻舸 "。此外,何俊杰还公布了文心一言插件生态—— " 灵境矩阵 ",现已全面开放。

百度所定义的新搜索,正是延续了 2010 年李彦宏提出的框计算的逻辑。  具备极致满足、推荐激发和多轮交互三个特点。即用户搜索问题时," 不再给你一堆链接 ",而是通过对内容的理解,生成文字、图片、动态图表等多模态答案;推荐激发则可以实时推荐用户关心的问题;在针对复杂需求时,多轮交互可以通过提示、调整等方式,满足用户个性化的搜索需求。

历史转折中的百度 需求到匹配的过程,也称之为 " 端到端 " 搜索,但这会打破百度曾经赖以生存的竞价排名模式,广告收入也是一直以来百度最大的现金牛,自己革自己的命并不简单,百度后面还有一场硬仗要打。

AIGC 的能力让一部分百度老应用有了新的活力,比如百度文档从内容检索工具升级为了内容生产工具、百度编辑器成为了内容生成工具;另一部分也探索了新的场景,比如百度轻舸通过 AIGC 一站式生成营销内容并智能投放,结合数字人生成平台 " 慧播星 " 帮助商家扩大营销范围和场景。

同时,随着大模型应用的逐步落地,百度也意识到凭借一己之力终究有限,无限的是合纵而连横。

这正是灵境矩阵的价值所在,这一平台大大降低了大模型插件开发的成本,让有创意、有想法的普通人,也能成为插件开发者。李彦宏表示,插件是一种特殊的 AI 原生应用,也是门槛最低,最容易上手的 AI 原生应用。

插件的特点在于 " 万能接口 ",既可以连接搜索、小程序、内容平台也可以连接任何入口,这样 " 即插即用 " 的使用方式,能让开发者、创作者快速加入到生态中。

何俊杰透露,上线一个月,灵境矩阵已经收到 2.7 万个开发者注册申请,覆盖了 20 多个垂直领域,其中包括企业、机构和个人开发者。

一位百度内部人士告诉光锥智能:" 应用层的大模型插件以灵境为主要平台,会放在文心一言和百度 App 中。千帆更偏底层调用,灵境更偏上层,甚至未来有可能在应用插件层面会替代千帆 "。

结语

2016 年,李彦宏曾说,百度离破产只有 30 天。" 恐龙脚上踩到一个瓢,几个小时以后他的脑子才能反应过来。所以不管恐龙长到多大,都会灭绝 "。

百度不想做恐龙,在意识层面,总是想着十步以外。

幸运的是,百度等到了新时代,度过了最艰难的时刻;不幸的是,在这个新时代的开端,任何费劲心力的抢跑,都会在漫长的竞争下显得微不足道。

但拿到了新的船票,至少是一个新的开始。

来源:光锥智能

随意打赏

提交建议
微信扫一扫,分享给好友吧。