李飞飞与她创造的新独角兽
当瑞典皇家科学院宣布将 2024 年诺贝尔物理学奖授予两位 AI 先驱后,不仅公众大为震惊,连获奖的 "AI 教父 "Geoffrey Hinton 本人在接到获奖通知时也不敢相信,直言 " 我怎么确定这不是一个诈骗电话 "。
并非所有人都认可这一授奖,有计算机科学专家表示," 诺贝尔奖委员会不想错过这波人工智能的热潮,所以巧妙地通过物理学的渠道把 Geoffrey Hinton 推了上去。" 诺奖委员会还在 社交 媒体 上发起投票:你知道机器学习模型是基于物理学方程吗?结果过半的人选择了 " 不知道 "。
在短暂的惊讶后,AI 行业内便开始了庆祝。Geoffrey Hinton 的众多学生、前同事、同行纷纷为两位获奖者送上祝福。其中,同样在人工智能领域立下开创性贡献的 "AI 教母 " 李飞飞在社交平台 X 上表示," 这真是令人无比兴奋!AI 的深远影响才刚刚开始。"
AI 正逐渐成为多学科交叉的领域。如果说 Geoffrey Hinton 是从心理学跨界进入 AI,在研究神经网络时还参考了一些物理学原理,那么李飞飞的经历与物理学的关联则更为明显。无论是早年求学,还是如今下场 创业 ,她的人生轨迹中时常出现 AI 与物理学的交汇,而她对 AI 发展的贡献同样伟大,还间接帮助了 Geoffrey Hinton 的项目。
如今,Geoffrey Hinton 对 AI 的研究已经得到诺贝尔物理学奖的承认,那么我们有理由期待,在未来几年内,李飞飞也可能会与这个全球最重要的科学奖项发生更直接的联系。
更像物理学家的 "AI 教母 "
李飞飞身上跟着很多头衔:斯坦福大学计算机科学系教授、斯坦福以人为本人工智能研究院院长、美国国家工程院院士、前谷歌副总裁……但她曾在公开场合表示,比起工程师,她觉得自己更像一位物理学家。
16 岁时,李飞飞跟着父母从中国移民到了美国。原本的高知家庭一下陷入 经济 上的困顿,必须依靠繁重的体力劳动为生,还未成年的李飞飞也得去餐厅刷盘子补贴家用。高中毕业后,普林斯顿大学向李飞飞发来了全额奖学金,她最终决定前往并主修物理学专业。
在本科期间,李飞飞着迷于阅读物理学家的传记。她发现,爱因斯坦、薛定谔、玻尔等伟大的人物到了职业生涯晚期时,都开始转向探讨人类的精神世界和生命奥秘。这让原本坚定走物理学道路的李飞飞突然对自己的追求产生了怀疑,不自觉地追随先驱的脚步开始思索生命的意义这类命题。
" 对我来说,人类生命的基本问题就是智能。带着这样的探寻目光,我步入了神经科学的世界。在几次神经科学领域的实习经历中,更加确定了对智能的热爱。于是,我从硬核的原子世界、物理世界,转向了对智能的探索。" 李飞飞后来在一档播客节目中提到。
到了硕博阶段,李飞飞决定转到加州理工学院攻读人工智能和计算神经科学。也是在那一时期,她选择将计算机视觉作为研究方向。现如今行业已经知道数据、算力、算法是 AI 的三大基础,而计算机视觉相关的图像数据正是最重要的数据分类之一,这一领域当时尚属冷门,计算机能够识别的物体种类极其有限。而业界大多观点认为算法才是计算机视觉的核心,李飞飞却意识到要想让机器认知到更大的世界,或许还需要一个庞大的数据集。
计划创建大规模图像数据集的李飞飞很快遭到了同行劝阻、人手不足、缺乏经费等多重困难。她和团队最终依靠亚马逊众包平台,将海量的图片标注工作分发给全世界近 5 万名人员,才将项目完成时间从 19 年大幅缩短到两年半。2009 年,日后影响整个 AI 行业发展的 ImageNet 数据集正式面世。初始版本共包含 320 万张标记图像,分为超五千个类别,之后进一步扩展至 1500 万张图像。
但 ImageNet 数据集并没有立刻获得行业内的广泛关注,李飞飞为此还组织了大规模图像识别挑战赛,希望能提升 ImageNet 的名气。而转折点就发生在 2012 年举办的第三届比赛上,也是在那时,李飞飞和 Geoffrey Hinton 的道路产生了交集。
那届 ImageNet 比赛上,Geoffrey Hinton 和他的两位学生 Alex Krizhevsky、Ilya Sutskever 设计了一种新的神经网络算法 AlexNet,以高达 85% 的识别准确率夺得了当年 ImageNet 挑战赛的冠军,创下了计算机视觉领域的世界纪录。AlexNet 基于 80 年代就已提出的深度卷积神经网络,但当时这套算法被业界视为 " 老古董 ",直到经过 ImageNet 数据集训练后才重获关注。AI 领域的深度学习革命也自此开启。
担心 AI 失控的 AI 先驱
时间来到 2015 年,Geoffrey Hinton 的学生 Ilya Sutskever 与李飞飞的学生 Andrej Karpathy 出现在了同一个名单上:OpenAI 的联合创始人。
创立初期的 OpenAI 是一家非营利性组织,以构建安全且有益的通用人工智能为使命。Ilya Sutskever 担任首席科学家一职,Andrej Karpathy 则是研究科学家,两人都推动了 OpenAI 在深度学习领域的发展。Ilya Sutskever 更是领导了从 GPT-1 到 GPT-4 等多个大语言模型及 ChatGPT 项目的研发,为 OpenAI 的崛起做出了巨大贡献。
今年 2 月,Andrej Karpathy 率先离职,转为创办一家 AI+ 教育公司。主导了去年 OpenAI" 宫斗 " 的首席科学家 Ilya Sutskever 也于 5 月宣布离职,启动自己的创业项目。
造成 Ilya Sutskever 与 OpenAI 首席执行官 Sam Altman 之间矛盾爆发的关键在于,Sam Altman 急于推动 商业 化,而 Ilya Sutskever 更担心 AI 技术的安全与风险,于是在去年年底联合董事会 " 罢免 " 了 Sam Altman。但那场震惊全球 AI 业界的风波以 Ilya Sutskever 的妥协告终,Sam Altman 很快便重返公司。自那之后,OpenAI 频繁出现高管人事动荡。截至目前,原来的 11 位创始团队成员仅剩 3 位。
本月初,OpenAI 完成了新一轮 66 亿美元的融资,推高公司投后估值达 1570 亿美元。作为融资条件,OpenAI 需要在两年时间内转型为一家营利性企业,不再由非营利性董事会控制。这再度引发了对 OpenAI 是否会将商业追求凌驾于安全性之上的担忧。
作为 Ilya Sutskever 的老师,Geoffrey Hinton 在发表诺贝尔奖获奖感言时也力挺学生,称 " 我特别为我的一名学生解雇了 Sam Altman 而感到自豪 "。这位 AI 泰斗还对人工智能可能造成的威胁发出警告,担心比人类更智能的系统或将最终掌控一切。就在去年,时任谷歌副总裁的 Geoffrey Hinton 宣布从谷歌离职,理由是想要不受约束地谈论 AI 的风险,并表示对自己一生的工作感到后悔。
与 Geoffrey Hinton 相似,李飞飞也经常在各种活动中呼吁关注 AI 可能引起的社会灾难风险。去年李飞飞出版自传时,Geoffrey Hinton 在推荐语中写道," 她对自己帮助释放的 AI 技术的巨大潜力和危险提供了紧急而清晰的描述。在这个关键时刻,我们迫切需要她来呼吁人们采取行动,共同承担责任。"
2017 至 2018 年期间,李飞飞曾担任谷歌云 AI 首席科学家。她称这段经历 " 刷新了自己的认知 ",让她看到 AI 技术的社会意义。除了能够推动社会的发展,AI 也可能带来侵犯隐私、虚假信息、取代人力等负面影响。因此从谷歌离开,重返斯坦福后,李飞飞推动创办了斯坦福以人为本人工智能研究院。这所机构希望能充当政界与 科技 界间的沟通桥梁,推动 AI 研究、教育、政策等方面的发展,以造福全人类。
但是,李飞飞和 Geoffrey Hinton 这两位先驱在面对一项 AI 监管法案的态度上却出现了分歧。作为美国首批最重要、最严格的 AI 法规之一,加州 SB 1047 法案旨在对功能强大的前沿 AI 模型进行安全测试,将波及 OpenAI 等在加州部署业务的 AI 企业。
Geoffrey Hinton 与众多 AI 从业者对此联名表示支持,称前沿 AI 公司合理防范大模型可能的危害是可行且适当的,SB 1047 法案代表了向前迈出的重要一步。李飞飞则单独撰文称,她并不反对人工智能治理和立法,但 AI 政策必须促进开源开发,提出统一且合理的规则,建立消费者信心,而 SB 1047 未达到这些标准。
当地时间 9 月 30 日,加州州长 Gavin Newsom 正式否决了 SB 1047 法案,认为该法案可能过于宽泛,会给 AI 公司带来负担。他还补充道,将会与包括李飞飞在内的多位专家合作,为加州制定可行的 AI 模型防护措施。
瞄准三维物理世界的空间智能
今年 5 月,斯坦福官网上李飞飞的个人介绍页面显示,从 2024 年初到 2025 年底处于 " 部分休假 " 状态。在职业社交平台领英上,她的最新履历也变为 " 新手 ",从 1 月起开始全职做一些 " 新事物 "。
不久后,李飞飞的新事业就得到了解密:一家专注于空间智能的 AI 初创公司。李飞飞是其联合创始人兼首席执行官。团队规模并不算大,公司现有 24 人,包括李飞飞在斯坦福的学生和多位华人科学家。
尽管尚未发布任何产品或技术的突破,李飞飞这家名为 World Labs 的初创企业却在短短几个月内迅速成为新的独角兽。World Labs 官网显示,公司已筹集到超过 2.3 亿美元的资金。领投方为硅谷知名风投机构 Andreessen Horowitz、NEA 和 AI 风投基金 Radical Ventures,其他 投资 者包括 Adobe、AMD、英伟达等大公司,以及 Geoffrey Hinton、Andrej Karpathy、谷歌首席科学家 Jeff Dean 等个人。
李飞飞曾多次解释她所选择的空间智能这一创业方向。在她的研究生涯中,视觉智能一直是其热情所在。但现在她认为,仅仅看见是不够的,真正的看是为了更好地行动和学习。而空间智能就是从二维进入到三维,在物理世界中进行感知、理解和交互。
在一场 TED 演讲中,李飞飞展示了一张 " 猫伸出爪子要把装有牛奶的杯子推下桌子 " 的图片,来阐述空间智能的工作原理。她解释称,在看到图片的一瞬间,人类大脑就会开始分析玻璃杯的形状、在空间中的位置,以及与周围物体的关系,并产生 " 想要行动的冲动 "。这种冲动就是具有空间智能的生物的本能,能够将感知和行动联系起来。
李飞飞团队目前正在收集一个包含了行为和动作的三维 ImageNet 数据集,用于训练计算机和机器人如何在三维世界中行动。他们在机器人语言智能方面已取得一些成就,能够根据口头指令让机械臂执行各种任务,例如打开抽屉、用面包等材料制作三明治等。
如果以实现达到甚至超越人类智能的通用人工智能为终极目标,现在的大多数 AI 还处于能够与人类互动的初级阶段,下一个门槛是如何让 AI 具备高级推理能力。业界许多主流观点认为,可以通过构建更大、更复杂的模型来提升推理能力,就像 OpenAI 在 9 月发布的 o1 推理大模型。
但李飞飞在最新的访谈中提到,如今的大语言模型和一些多模态模型在底层表示形式上仍然是一维的,与空间智能的方向完全不同。这只是生成式人工智能革命的第一章。在她看来,动物和人类等智能生物拥有在世界中互动、创造文明、甚至随心所欲地完成各种任务的能力,将这些能力转化为原生的三维技术,才是释放潜在 AI 应用洪流的关键。
就像她在学生时代阅读到的那些物理学巨匠,李飞飞的发言也常常蕴含一些哲学意味。" 这也回到了我所追寻的北极星——为什么选择空间智能,而不是平面像素智能?我认为智能的进化路径必然会转向可操作性。"
来源:蓝鲸财经