欧洲版OpenAI CEO:开源模型没有任何风险,我只看到了好处
有着“欧洲 OpenAI”之称的 Mistral AI,仅仅成立一年,估值就达到了 60 亿美元。
自成立以来,Mistral AI 在开源领域频频发力,前不久更是发布了他们的新一代旗舰模型 Mistral Large 2,用不到三分之一的参数量实现了在性能上比肩 Llama 3.1 405B。
日前,Mistral AI 联合创始人兼首席执行官 Arthur Mensch 在《时代》杂志专访中,详细探讨了 Mistral AI 如何吸引稀缺人工智能 (AI) 人才、如何实现盈利以及欧洲 AI 生态系统的缺失等话题。
核心观点如下:
-
Mensch 表示,开源模型没有任何风险,他只看到了好处;
-
开源模型是一个中立的工具,可以被用来做任何事情;
-
人们没有因为你可以用 C 语言制作恶意软件就禁止使用 C 语言;
-
从某种意义上说,AI 并没有改变软件的任何东西,只是定义软件的一种更抽象的方式;
-
用于构建这些应用程序的技术并不是唯一可以被监管的东西,控制投放市场的应用程序的质量非常重要;
-
从某种意义上说,大模型可以被看作一种更抽象的编程语言,将改变我们未来 10 年的工作方式;
-
Mistral AI 在开源上并没有改变,但也一直希望在开源领域拥有领先的模型,同时也有一些只有通过货币化服务才能获得的高级功能。
学术头条在不改变原文大意的情况下,做了简单的编译。内容如下:
在过去的一年里,总部位于巴黎的 Mistral AI 迅速崛起,成为欧洲本土最具影响力的 AI 公司之一。这家初创公司已经发布了 6 款语言模型,这些模型可以回答问题、生成代码和进行基本推理。
今年 6 月,Mistral AI 表示其在一轮融资中筹集了 6.45 亿美元,估值超过了 60 亿美元。2 月,他们与微软达成协议,向后者的客户提供他们的模型,从而换取微软计算资源的使用权。
Mistral AI 联合创始人兼首席执行官 Arthur Mensch 在有关具有里程碑意义的《人工智能法案》的辩论中,认为立法者与其监管像 Mistral 这样的基础模型,不如重点监管其他人如何使用这些模型。他还反对限制 AI 开发者自由分享他们的创造成果。他说:“我认为开源模型没有任何风险。我只看到了好处。”
《时代》杂志就如何吸引稀缺 AI 人才、Mistral AI 如何实现盈利以及欧洲 AI 生态系统的缺失等话题,与 Mensch 进行了深入谈话。
Q: 几个月前,你们的首席商务官 Florian Bressand 告诉 CNBC,Llama 研发团队如今有一半以上都在 Mistral 工作。你们是如何从 Meta 吸引到这么多优秀的研究人员的?
起初,我们拉拢了我们自己的朋友。我们之所以能这样做,是因为我们对该领域做出了一些有意义的贡献,因此人们知道与我们共事很有意思。后来,从 12 月份开始,我们开始聘用一些我们不太熟悉的人。这归功于我们所遵循的战略,即推动这一领域朝着更加开放的方向发展。这也是很多科学家的使命,他们和我们有着相似的理由,喜欢以前自由交流和信息流通的方式。
Q: 全世界很少有人能训练出像 Mistral 这样的 AI 系统。我知道法国的 AI 产业很发达,但你认为你成功地招募到了相当一部分 (甚至全部) 懂 AI 的人吗?
(当然) 不是所有人。我们的很多朋友在这个行业内,他们在谷歌、OpenAI,还有几个人留在 Meta。但可以肯定的是,我们吸引了 15 个知道如何训练这些模型的人。虽然很难估算人才库的规模,但我认为这可能是当时知道如何研究这些东西的人的 10%。
Q: Mistral AI 一直在融资,你们把钱花在什么地方了?
我们主要把钱花在了计算上。这个行业的结构与软件业不同,因为一开始你需要投入大量资金来组建科研团队,建立技术前沿的模型。
Q: 几乎所有其他基础模型公司的高管都谈到,他们预计未来几年将在计算方面花费 1000 亿美元。你们是否也有类似的预期?
我们在过去 12 个月内烧掉了 2500 万欧元左右的资金,这才有了我们今天的成就 ——我们的业务遍布全球,我们的模型在性能和效率方面都处于领先地位。我们的论点是,我们可以更有效地利用资本,我们正在开发的技术实际上是资本密集型的,但只要有好的想法,就可以用比我们的竞争对手更少的开支来实现。2023~2024 年,我们已经证明了这一点,预计 2024~2025 年仍将如此。显然,我们的支出会更多。但我们的支出仍将只是竞争对手的一小部分。
Q: 你们目前盈利吗?
还没有。我们的投资相当大,对于一家成立仅 12 个月的初创公司来说,盈利并不是预期内的事情。
Q: 盈利计划是什么?你们的商业模式是什么?
我们的商业模式是建立前沿模型,并将其提供给开发者。我们正在构建一个开发者平台,让开发者能够定制 AI 模型,开发差异化的 AI 应用程序——他们可以将技术部署到他们想部署的地方,因此有可能不使用公共云服务,这让他们能够定制模型,而不是像现在那样使用封闭的不透明 API 背后的通用模型。最后,我们还非常注重模型的效率,因此能够实现一定的推理能力,使模型尽可能快、尽可能便宜。
这就是我们正在打造的产品:我们自己托管的开发者平台,然后通过 API 和托管服务为客户提供服务。但我们也为希望完全控制技术的客户部署该平台,这样我们就可以让客户访问软件,对其应用程序中使用的数据进行完全控制。
Q: 是否可以这样说,你们的计划是以更低的成本为你们和你们的客户制造几乎可以与竞争对手媲美的 AI 模型,且更公开地提供这些模型?或者说,你们是希望在绝对能力方面与竞争对手最先进的模型或“前沿模型”相媲美?
我们计划继续迎头赶上,最终与其他公司一样具有竞争力。但实际上,我们的业务模式是其他公司所不具备的。我们更愿意分享、定制和部署我们的技术。在这些方面,我们不再拥有控制权。
Q: 最近,你们将你们能力最强的模型以 API 的方式提供服务,而你们一开始的所有模型都是开放的。你们为何做出这一改变?
我们在这一点上并没有改变。我们一直希望在开源领域拥有领先的模型,同时也有一些只有通过货币化服务才能获得的高级功能。
我们所提供的服务中有很大一部分是开源的,这使得开发人员能够采用我们的技术,并利用我们的技术构建他们所需要的一切。最终,当你想把他们构建的工作负载转移到生产中,或者你想让它们变得更好、更高效、管理得更好、维护成本更低时,这些开发人员就会来使用我们的平台,使用我们潜在的优化模型来提高推理能力的性能和速度。
我们会一直这样做下去。开源对我们来说非常重要。我们正在其基础上构建开发者平台,这显然会被货币化,因为我们确实需要一个有效的商业模式。但我们希望能为使用我们开源模型的开发者带来额外的价值。
Q: 你经常说,欧洲不能依赖于美国的 AI 公司,需要一个本土的前沿模型。Mistral AI 是欧洲最著名的 AI 公司之一,但它与微软公司建立了合作伙伴关系,从而获得所需的算力。Mistral AI 在这方面对微软的依赖是否会限制其作为前沿主权 AI 角色的能力?
我们有四个云提供商。我们在设计上是独立于云的,这也是我们从第一天起就采取的策略。我们的模型可以通过 Microsoft Azure 提供,也可以通过 Amazon Web Services 和 Google Cloud Platform 提供。我们将这三者都用作云提供商。我们还使用不同的云提供商——尤其是 CoreWeave 来提供训练。我们建立了自己的技术堆栈和分销渠道,以建立我们认为客户需要的独立性。
Q: 除了在欧洲建立 AI 实验室,欧洲是否还应该尝试建立自己的主权计算基础设施?
我认为这将有利于生态系统。但欧洲并不是一个独立做出决定、凭空建造一些东西的行为体。这涉及一个生态系统的问题,即如何确保欧洲能够有效地提供一些计算基础设施。
这对我们的客户来说非常重要,因为其中一些客户是欧洲客户,他们确实希望对自己使用的云基础设施拥有某种形式的主权。在这方面,我们模型的一些可及性、推理和平台实际上已经部署在欧洲。但还可以有一些改进。这不是由欧洲决定的。它是一个生态系统,需要认识到有些需求是可以解决的。我们希望在不久的将来能有一些欧洲云计算合作伙伴。
Q: 前法国数字事务部长、你们的联合创始人之一 Cedric O 警告说,《人工智能法案》可能会“扼杀” Mistral AI。该法案已经通过,但通用目的 AI 模型的行为准则尚未制定。它们应该是什么样的呢?
一般来说,《人工智能法案》是非常可行的,因为我们所受到的限制是我们已经满足的限制。我们已经将使用模型的方式、评估模型的方式记录在案,这已成为对前沿模型的要求。因此,这样做是可以的。
关于训练数据集的透明度问题,我们还需要进行一些讨论,这是我们非常希望实现的,但这需要与商业机密进行衡量。我们的很多知识产权也体现在我们处理数据和选择数据的方式上。这也是他人的知识产权。作为一家小公司,我们对自己的知识产权非常谨慎,因为这是我们唯一拥有的东西。因此,从这个角度来看,我们有信心找到一种各方都能接受的方式。
我们被要求参与技术规范的制定并提供意见。我们也希望欧洲能够独立做出选择,以促进生态系统的发展,并让每个人都能快乐。
Q: 你们竞争对手的高管们有很多关于 AI 将如何在未来五年或十年内改变世界的言论,以及他们所担心的事情是什么,以及更强大的 AI 系统的发展可能带来的各种变革。你预测过 AI 会如何改变世界吗?
我们构建了一种强大的技术,但我认为现在有一种趋势,即假定这种强大的技术可以解决所有问题。在 Mistral AI,我们非常专注于确保我们的技术能够提高生产力,为某些垂直行业、某些领域带来推理能力,从而产生社会效益。
人类创造的一切都是工具,而我们带来的新工具则带来了新的抽象能力。 因此,从某种意义上说,你可以把它看作一种更抽象的编程语言。我们使用计算机可理解的语言编程已经有 50 年了。如今,我们只需要使用英语、法语或任何语言与系统对话,就可以创建系统。这为工人和开发者带来了一种新的抽象方法,这显然改变了我们未来 10 年的工作方式。
我认为,如果我们妥善处理,确保每个人都能掌握这一工具——这正是我们创建 Mistral 的真正原因——我们就能确保它改善全世界每个人的生活,改善不同社会经济地位的人的生活。要做到这一点,对我们来说,首先要在医疗、教育等领域实现差异化应用。
同样非常重要的是, 要确保人们接受培训并有机会获得技术,而且要使人们能够获得这种技术 ——以比其他方式更开放的方式提供技术,是加快技术发展的一种方式。这还不够,政治决策者还必须制定扶持计划,加快世界上尚未接入互联网的地区的互联网接入速度。但我认为,我们正在开发的新工具——生成式人工智能——在帮助人们使用这种新工具方面具有积极作用。
Q: 你能想象未来会发生什么情况吗?如果你已经开发了一个 AI 模型,或者你正在开发一个模型,而且你注意到了它的某些功能。在这种情况下,你会不会决定最好不要将模型开源,而是将其保留在 API 后面,或者甚至不将其部署在 API 后面。
在可预见的未来,我们不会这样。我们建立的模型具有可预测的能力。我们发现,集体管理软件及其使用方式的唯一途径就是开源。网络安全就是如此。操作系统也是如此。因此,当今最安全的技术就是开源技术。
从某种意义上说, AI 并没有改变软件的任何东西。它只是定义软件的一种更抽象的方式。 因此,我认为开源模型没有任何风险。我只看到了好处。这是一个中立的工具,可以被用来做任何事情。我们没有因为你可以用 C 语言制作恶意软件就禁止使用 C 语言。我们发布的模型并没有什么不同。因此,控制投放市场的应用程序的质量仍然非常重要。但是,用于构建这些应用程序的技术并不是唯一可以被监管的东西。
原文链接:https://time.com/7007040/mistral-ai-ceo-arthur-mensch-interview/
本文来自微信公众号: 学术头条 ,原文作者:Will Henshall