李彦宏,越过山丘
无论人们以怎样的视角解剖中国人工智能的激流岁月,在企业巨头进军 AI 的这一章,故事总是这样开头:
2012 年那场全球知名的「AI 拍卖会」中,出现了一家中国公司——百度的身影。时年,Geoffrey Hinton 率先验证了深度学习的威力,并将这项成果编撰为一篇 9 页的论文发表。研究问世后,Geoffrey Hinton 很快收到了来自百度的邀约。
那时,深度学习还不是一个显学,但李彦宏却超前地预见了这项新技术的潜力,率先向 Geoffrey Hinton 伸出橄榄枝。在他的带动下,谷歌、微软两家美国科技巨头和日后成名的初创企业 DeepMind 也争相邀约,最终将 Geoffrey Hinton 的成果变成了一场知名的「AI 拍卖会」。
从 1500 万美元开始,2000 万、2200 万元、3000 万元、4300 万元,竞拍开始后的每个小时,价格都在快速攀升,而百度始终是出价最高的那一家。最终,出于非价格的考虑,Hinton 还是决定加入同为美国公司的谷歌,百度惜败,但这也让李彦宏更坚定了开拓中国 AI 的决心。
2013 年,李彦宏在百度主导成立了全球第一个深度学习研究院(IDL),并亲自出任院长。然而,此后数年间,深度学习浪潮起起落落,历经低谷,全力投入人工智能的百度也由此饱经商业回报的考验;李彦宏本人,由于对技术的追求过于执着,也受到大众的质疑。
直到 2023 年,ChatGPT 催发 AI 奇点。百度最早推出「文心一言」等一系列大模型成果,人们才发现:百度在 AI 领域十年饮冰,便是为了等待这一日的迸发。十年前,中国工业界的 AI 发展为零,百度从头开始;十年后,百度是全球少数全栈布局芯片、框架、模型与应用四层架构的公司。
9 月 7 日,《时代》周刊首次评选全球百大 AI 人物,李彦宏被评为「中国最杰出的未来主义者」,与马斯克、黄仁勋、Sam Altman 等人同时入选全球 AI 领袖。
十年跋涉,李彦宏终于越过山丘。
01「中国 AI 教父」李彦宏
鲜少有人注意到,李彦宏是中国互联网企业中最早的人工智能追随者与布道者。北京是中国 AI 技术创新的中心,自 21 世纪初始,这里有两座 AI 人才聚集的高地,一座是号称「中国 AI 黄埔军校」的微软亚洲研究院,另一座则是百度。
如果从更严格的地缘意义来看,百度作为土生土长的中国企业,其实更具备前者的光环。而这其中,李彦宏对 AI 的追求与人才的重视,是 2012 年深度学习崛起后百度 AI 盛世形成的核心原因。
图片来源:视觉中国
2012 年李彦宏招入余凯(后来地平线的创始人)、成立深度学习研究院后,李彦宏意识到,,如要研究深度学习,就一定要招世界上最好的人才。他开始向全球招揽徐伟、张潼、吴恩达等等知名人才,每个人都是亲自出马接待,给予高规格的待遇:
徐伟风骨高存,李彦宏向人请教如何将他吸引进百度,对方随口说了一句「你得请他吃饭」,李彦宏就真的专门去请徐伟吃了一顿饭,徐伟最终入职百度,主导研发了后来的百度深度学习框架「飞桨飞桨」;
2014 年,吴恩达加入百度担任首席科学家,李彦宏亲自发内部信欢迎,吴恩达在线回复。因为这两封信,当天六位原先还在犹豫的顶级人工智能专家通过邮件向百度回复,表达了加入百度的意向。吴恩达在百度的三年,带领百度人工智能团队增长至 1300 人,其中百度研究院成员 300 人,百度由此培养出大量的 AI 人才。
本次《时代》周刊评选百大 AI 人物,吴恩达、Dario Amodei 等人也入选其中。Dario Amodei 是美国人工智能公司 Anthropic 的联合创始人兼 CEO,2014 年在斯坦福大学结束博士后研究生涯后的第一份工作就是加入百度硅谷 AI 实验室担任研究员。
此外,李彦宏也是「百度少帅计划」的主要推动者。除了引进张潼、徐伟等「老帅」,李彦宏当时还认为应该吸引年轻人加入百度,就在深度学习研究院落实了「百度少帅计划」。通过百度少帅计划,李磊(后字节跳动 AI Lab 总监)、李沐(后亚马逊 AI 首席科学家)、顾嘉唯等等杰出青年脱颖而出,崭露头角,让更多年轻人看到国内的 AI 就业机会。
在深度学习的早期,除了从国外引入优秀人才,李彦宏也坚持在百度内部培养人才。李彦宏的想法是,百度正在探索的是前沿方向,现成人才本就稀缺,因此需要自己培养。2012 年后,百度在内部培养了一批批 AI 人才,如王海峰,2017 年接棒百度研究院、如今担任百度 CTO,负责百度文心大模型的整体规划;吴华,主导研发了百度文心 ERNIE 3.0 Zeus,是文心大模型团队的核心骨干。
十年来,百度研究院为百度和 AI 行业培养出了数千名 AI 人才。据中国信通院报告,百度以 85.5 分位居「AI 产业创新人才」全国第一,在预训练大模型、深度学习、自然语言处理等七大领域均排名第一。最近五年,百度 AI 人才的 AI 专利申请量和授权量连续五年位居全国第一。
在 2020 年的《致股东信》中,李彦宏称,百度是一家技术公司的另一含义是:百度培养技术人才,并输出技术文化,让更多企业看到技术的价值,并重视对技术的投入。多年来,百度坚持在深度学习、对话式人工智能操作系统、自动驾驶、AI 芯片等前沿领域投入,搭建起了中国互联网的技术骨架。在李彦宏看来,这也是一件意义非凡的事情。
李彦宏本人是技术出身,发明了超链分析等基础技术,并研发出了全球最大的搜索引擎——百度搜索。搜索与广告是百度的支柱业务,主要涉及文本信息检索与推荐,与自然语言处理等技术的终极追求天然契合。从做百度搜索的第一天起,李彦宏要解决的就是人工智能最终要解决的问题,即让机器真正地理解人的意图、并做出相应的回应。
因此,10 年前,李彦宏就意识到,人工智能技术可以解决搜索问题,并带领百度在搜索基础上实现了自然语言处理、图像、语音等 AI 技术的突破。尤其,自然语言处理被誉为「AI 皇冠上的一颗明珠」,在 NLP 领域,百度的水平处于中国最前沿。百度研究院历来的掌舵人,从余凯到王海峰,都是 NLP 领域的科学家。
李彦宏知道,最前沿的技术浪潮是等不来的,必须提前 10 年、20 年去布局。有人统计,作为全国政协委员,李彦宏在连续 8 年的「两会」中,提出了 13 份 AI 相关提案。AlphaGo 战胜人类世界围棋冠军的 2016 年,李彦宏在公开场合提到「人工智能/AI」500 多次。2017-2019 三年,李彦宏作了 40 次演讲共计 15 万字,均涉及 AI。
2012 年,李彦宏就专门写了一封邮件,鼓励全百度产品经理了解 AI 技术的最新趋势,是中国最早提出「AI 原生」概念的布道者。近十年来,百度累计研发投入超过 1462 亿元;在被称为「AI 寒冬」的 2022 年,百度研发投入 233 亿元,研发强度 18.85%,排名中国民营企业研发强度第一。
02 大模型爆火:未来主义者的破冰时刻
搜索业务与自然语言处理技术息息相关,因此,中美两国最大的搜索引擎公司——谷歌与百度,都曾经受同一个疑问:百度/谷歌是一家搜索引擎公司,还是一家 NLP 公司?
与百度相同,谷歌在 NLP 技术研发上也投入了大量人力与财力。2018 年,谷歌大脑团队发布双向预训练语言模型 BERT,开启了全球 NLP 的预训练语言模型时代;2019 年,百度紧随其后,发布预训练语言模型 ERNIE 1.0,是中国最早的预训练语言模型成果,为后来文心大模型的研发奠定了基础。
追溯百度的大模型迸发,人们知道,这绝非偶然,而是一个坚持长期主义、未来主义的 AI 追随者在历史长河中的必然。李彦宏与百度,均为 AI 时代的到来做了长久的积累与准备。
十年前,百度就看到 AI 时代的四层架构。IT 时代,技术栈由芯片层、操作系统层与应用层三层组成,而 AI 时代则变为芯片、框架、模型、应用四层,百度是全球少数全栈布局与自研的科技企业。芯片层,百度有昆仑芯;框架层,百度有飞桨飞桨;模型层,百度有文心大模型;应用层,百度基于文心开发了文心一言,重构了如流、搜索等等产品。
作为国内最早关注大规模预训练语言模型的团队之一,百度率先在技术团队与产品创新上迈步前进。据了解,百度文心大模型团队超过千人,由百度从 2012 年重视 AI 开始培养起来的内部人才王海峰、吴甜与吴华等人带队,成员覆盖算法、交付、安全、生态、社区等环节。以文心大模型为中心,李彦宏亲自带队,率领百度各个业务线与时俱进,重视 AI 原生,拥抱新的 AI 时代。
百度的大模型团队也是国内最稳定的 AI 团队之一。究其原因,百度从互联网 PC 时代走来,李彦宏深谙从自然语言处理到搜索的技术逻辑,敢于在不确定的探索时期大胆拍板,逐渐扩张。
在过去的许多年,即使 AI 研发投入的商业回报不甚显著,甚至饱受质疑,但李彦宏对 AI 的信仰从未改变。百度在 AI 技术上的追求一直是国内顶尖,技术人员的投入上也是国内最前列。只有长久的积累,才有爆发的可能。
2020 年 GPT-3 火时,除了学术圈,没有太多人关注到这项技术的价值,但百度仍分配了大量资源给文心团队;2022 年年底 ChatGPT 爆火后,人人皆言 NLP 与大模型,拥挤的视觉赛道开始分流给原先冷清的语言社区,但百度已率先发布大模型成果:
3 月 16 日,文心一言开启内测;6 月,文心大模型 3.5 升级,模型性能在十余个国内外权威测评中位居第一;8 月 31 日,文心一言全面向公众开放,首日回复 3342 万个问题,文心一言 APP 在多家应用商店中登顶排行榜。在过去「得视觉者得天下」的十年,百度坚持投入 NLP 研发,才有了今天大模型时代的先发制人。
文心一言 APP | 图片来源:视觉中国
9 月 1 日,国家网信办发布境内深度合成服务算法备案信息公告,百度同时获批向公众开放服务备案和深度合成服务算法备案。这意味着,百度跃升「中国大模型双料王」:继文心大模型之后,百度数字人、语音合成等也正式完成合规备案。
据了解,今年百度世界大会期间,百度还将推出文心大模型 4.0。
在 2020 年的《致股东信》中,李彦宏写道:「每当百度徘徊在十字路口,我都会问自己,什么能够让你真正致胜未来?
我认为就是两方面:一是你信仰什么,What do you really believe in;一是你有多大的决心,your determination。从过去到现在,我们的信仰没有变,我们相信技术可以改变世界。我们也有决心,有耐心。我们熬得过万丈孤独,藏得下星辰大海。」
从 2021 年推崇云智一体、喊出「AI 原生」的口号,到如今驱动百度全员以「AI 原生」、「大模型原生」去思考下一个时代的机遇与挑战,李彦宏始终是中国最敢投入前沿方向的科技领袖。只有面向未来的未来主义者,才不会被新的时代抛弃。
也是在李彦宏的坚持下,百度这家从 PC 时代崛起的企业,经过十年洗刷,再一次站在了时代的聚光灯下。李彦宏对 AI 的信仰,使百度焕发出新的生机。越过山丘,或许百度将创造一个不一样的时代。