和奥特曼最铁的OpenAI联合创始人,为什么离职?
最近关于OpenAI“散伙”的标题党新闻刷屏了,也就我们了解的一些情况分享下。
目前公开的信息,是联合创始人兼总裁Greg Brockman休Sabbatical (学术休假) 到年底,他自己也发了个twitter解释;联合创始人兼Super Alignment负责人John Schulman离职并加入了Anthropic;去年加入的产品副总裁Peter Deng也离开了OpenAI。
Greg是最早的几位cofounder之一,先担任公司CTO,然后担任了公司的总裁,一直是Sam Altman最铁的同伴,在去年11月的政变中,也非常支持Sam,在董事会解雇Sam Altman几小时后,他就直接选择了辞职,也一直在帮助Sam Altman串联同事。并且Greg和Greg的太太,努力说服Ilya最终反对董事会,对结束政变起了非常大的作用。 目前看起来,Greg休的是Sabbatical,这个是欧美公司和学界给资深员工的一种福利,每隔5-10年不等,可以休3个月到1年的带薪假,因此是否是离职,目前还没有明确的说法。
即使Greg离职,我们认为,对于OpenAI未来模型的研究,包括GPT5和GPT6的实际影响也是可控的。 Greg一直以来给人一种solo coder的感觉,大部分时候都是一个人在做开发,或者只带很少的special task force。最早之所以会由Mira接管CTO,也是因为Greg不喜欢管理团队,只喜欢编程开发。
早期,Greg作为超级工程大牛,奠定了从OpenAI从一开始,到GPT4的整个Infra基础架构和模型训练框架,传说那时候他一个人手搓出了一半的Infra code。 Greg还非常喜欢自己一个周末闭关放一个大招,比如引发巨大争议的GPT3 API,就是Greg自己一个周末写出来的,然后周一交给团队调试。ChatGPT Plugin也是类似的被Greg一个周末搞出来的。 GPT4之后,Greg对于模型research参与的就比较少了,他的重心更多放在了产品开发,另外也会充当救火队员,解决一些项目和工程的紧急问题。
同时,也有很多猜测,Greg的solo风格造成过一些OpenAI内部的分裂, 比如Dario之所以带领了一半GPT3的核心研究人员离开OpenAI并创立Anthropic,就是因为Greg没和团队商量,就一个人搞出了GPT3 API,可能造成模型安全的问题。而11月董事会之所以开除Sam,也猜测和Greg激进的推广ChatGPT Plugin和GPTStore,而没有严格遵守safety review有关。 如果Greg最终离职,可能也是和这个因素有关。
真正离职的John Schulman,被称为ChatGPT之父,是Policy-based RL领域的超级大神 ,以其在Proximal Policy Optimization (PPO) 和Reinforcement Learning from Human Feedback (RLHF) 方面的开创性工作而闻名。他曾在加州大学伯克利分校获得计算机科学博士学位,师从强化学习大佬Pieter Abbeel,随后在OpenAI担任研究科学家,推动了多项关键技术的发展, 尤其是PPO,是John Schulman及其团队在2017年提出的一种新型强化学习算法。这一算法通过引入限制策略更新的变化范围,从而显著提高了强化学习算法的稳定性和效率,奠定了ChatGPT,乃至我们这波整个AGI浪潮的基础。 John也一直担任OpenAI post training团队的负责人,Ilya离职后也接任了Super Alignment Team的leader (Super Alignment Team感觉有点被诅咒了,两人负责人都离职,重要成员Jan Leike也离职了) 。
John的离职,推测更有可能是文化和研究理念的不合。 John一直和Ilya走得比较近,也是非常纯粹的researcher,同时对于safety和alignment也有很强的追求。目前OpenAI逐渐从一个纯粹的研究机构,向一家商业化公司转变,Super Alignment也是命运多舛。虽然John离开了,但是OpenAI的post training team还有非常多顶级天才的研究人员,相信他们会接过John的衣钵,继续探索AGI的未来。只是这个未来,是否还有人类存在的空间?
另外一个离职的高管Peter,1年前才加入,主要也是负责产品。OpenAI本身survive的难度很高,内部优胜劣汰非常残酷,Peter应该也是比较正常的离职。 他加入之后OpenAI推出的新产品都不能算很成功,尤其是GPTStore。