水晶项目:Sam Altman和孙正义要做什么?
2月3日,OpenAI放出了Deep Research功能,是否炸裂还有待大伙验证,但显然这是OpenAI为了抵挡DeepSeek R1攻势所做的重要回应。
实际上,这一天OpenAI还有一个大事,那就是Sam Altman出现在东京软银大会现场,与孙正义一起做了关于合作项目 (孙正义给起了个新名字“水晶”) 的同台演讲以及现场谈话。
两人的谈话透露了一些软银和OpenAI合作项目的细节,对孙正义而言,这个项目的核心理念貌似是整合访问所有软银企业的源代码和信息记录打造AGI (不予置评……) ,还时而故作轻松地点一下DeepSeek (可见DeepSeek给大家留下的阴影……) 。
完整视频可前往B站: 《孙正义和奥特曼现场对话| 软银和OpenAI在东京推介人工智能-哔哩哔哩 》 。
以下是全文实录,和感兴趣的同学们分享。
孙正义: 我的名字是孙正义,我是日本银行集团有限公司的首席执行官。今天,我想谈谈已经获得政府正式批准的OpenAI合作项目,并做一个包括报告在内的演示。在开始之前,我想给你们展示一些有趣的东西。这就是它:水晶。
当你听到“水晶”这个词时,你会想象什么?如果你听到任何超越人类智慧的东西,你可以想象未来。如果你听到需要解决的问题,应该如何解决,它意味着什么,你想知道的是什么,你想问的是什么,如果你听到这些,你就可以理解任何事情。有很多这样的故事,像科幻小说一样的世界即将到来。我们将把这带入AGI的世界,AI的世界,以及人工超智能的世界。今天,我想谈谈这个水晶,一个水晶球。我希望你们记住这个。让我们一边握着它一边谈。
最近在美国,特朗普总统与甲骨文的拉里·埃里森宣布了“星际之门”,这是他就职的第一天,这是一场非常繁忙的日程,有许多政治活动,但特朗普总统抽出时间为我们宣布了这个项目。我认为这是一个对美国非常重要的战略项目,请期待它。我认为这是一个将在未来100年、200年或300年对人类产生重大影响的项目。我很兴奋能够与SAM、甲骨文和阿联酋一起参与这个项目。这就是“星际之门”,我将从现在开始谈论“星际之门”。
首先,我认为AGI将在不久的将来实现。就在一年前,我在我们的活动中说过,AGI将在10年内实现;几个月前,我说AGI将在2到3年内实现;现在,我想说AGI将会比那更早实现。这个AGI与今天的公告有关。我认为AGI将在个体世界之前实现。
我认为AGI将在个体世界之前实现,这非常困难。但如果将其缩小到单个公司或一个小组,就会有压倒性的数据量。为了实现AGI,拥有丰富、高质量且在某种程度上有限的数据至关重要。拥有深度、广度和实时的数据是重要的,拥有互联网上没有的数据同样重要。基于这些数据,我们可以进行各种训练并提出假设。因此,我相信AGI将首先在大型公司内部实现。
此外,这将花费大量资金,需要付出很多努力,但我相信一家大公司有能力支付。这就是我的信念,因此我相信AGI将从一家大公司开始。正如宫川先生早些时候提到的,今天我们拥有大约50%的日本GDP,这就像一个日本企业集团,我们有大约500家日本公司的首席执行官。
今天,我想宣布AGI将从一家代表日本的大公司开始。我正式同意与Sam Altman一起,我们将以一家代表日本的大公司开始AGI。我对此感到非常高兴,我会在稍后告诉你更多关于此事的内容。
当然, 这个AGI不仅限于公司,也包括医疗、教育和政府,它会扩展到个人家庭。 此外,暂时Sam今天会做一个演示,这是针对公司的。这个AGI将为我们全天候工作,一年365天。到目前为止,我们不得不搜索互联网,或者发送电子邮件,人类必须辛苦劳动,AI也必须辛苦劳动。
第一次,AI成为了一名代理人,并辛苦工作了365天,每天24小时,它在我们睡觉的时候工作,AI代理人一起工作,他们在按按钮时一起工作。这就是它的工作方式。
请期待稍后的演示。我一开始就给你们展示了这个。我为什么要拿着这个?这是最新的企业人工智能,我们将其命名为CRYSTAL。CRYSTAL的拼写是C-R-Y,当然,还有很多其他的词,所以我觉得用一个字符更好。CRYSTAL的意思是水晶,在法语和西班牙语中,CRYSTAL是正确的拼写。
作为合作伙伴,软银和OpenAI这两家公司将推出企业用的CRYSTAL。 我们将开发它,以便尽快进入AGI和ASI的世界,我们将从日本开始销售,由SoftBank和OpenAI主导。最近,日本作为世界第一的主题有所减少,幸运的是,AI和AGI在世界上是最受欢迎的。我们将从日本开始。我想借此机会感谢今天在场的所有大公司,今天是历史性的一天。
我们将与SoftBank和OpenAI成立一个50%-50%的合资企业,我们已经正式签署了谅解备忘录。公司名字是SB OpenAI Japan,这是SoftBank集团和SoftBank有限公司之间的合资企业。我们也在特朗普总统宣布启动合资企业星际之门的前一天早晨正式签署了谅解备忘录。那么,Crystal要做什么呢?它将查看公司的数据,所有的系统,例如,软银集团、LINE、雅虎,SoftBank Co.、 Ltd., ARM和其他公司,约有2500个机器系统在运行。
每个系统都有独立的数据库。这个系统的源代码已被创建了大约30年。Crystal可以读取所有的源代码。银行家和汽车制造商可以读取已经创建了10年、20年或30年的机器的源代码。如果你读取一个已经创建了30年的机器的源代码,你会意识到这有多么困难、无聊和枯燥。编写源代码的人已经退休,即使你想问他,你也不知道他为什么编写这个源代码。
当然,源代码中有很多错误。但Crystal可以读取所有的源代码,它可以读取所有内容,它知道源代码编程的含义,编写它的目的,具备的功能,以及应该在哪些地方进行版本管理。它可以用最新的语言替换所有这些信息,甚至可以接受使用最新语言的版本管理。人类程序员进行编程和版本管理的时间几乎到了,这个时刻已经到来了。
它可以阅读我们组内的所有源代码编程,它可以一次性读取所有内容,而且可以参与所有会议。我们每天都有各种会议,而Crystal参与了所有的会议,它参与并与我们讨论,当我们提问时,它会回答。它与其员工共享它的想法。当我们与客户谈判时,无论是商业交易还是合同,Crystal都会参与。
我们还有一个电话中心,每天24小时接听电话,一年365天不会停。我们有时需要等待5到10分钟,有时候我们甚至无法回答一个问题,这些事情时不时会发生。但是Crystal会接听所有的电话,它在呼叫中心直接与我们的客户对话,并且解决所有问题。它还会接收并阅读所有员工的电子邮件。Crystal参与所有会议,会议结束后,Crystal不仅可以记住会议内容,它甚至记得上次会议,三年前的会议,谈判的理由等内容,在这一过程中,长期记忆变得非常重要。
现在,作为一个提示,我们可以问很多问题,这叫做提示工程,这是一个提出问题的好方法。但我们不再需要它了,现在,我们不必解释我们想问的是什么,我们可以高层次地提问。
通过观看新闻,我可以看到概率理论是如何变化的,你可以实时看到这一点,你可以理解长期记忆,并做出正确的决定。这太惊人了。例如,如果你的下属离开公司,你将失去长期记忆,即使只有你一个人,你也会失去你的长期记忆。
从现在开始,除了成为一个代理人,长期记忆将变得重要,这是一个巨大的挑战。但Crystal会根据你的长期记忆为你提供正确的建议。请记住长期记忆。从去年到今年,我一直在说代理人是关键字,你将成为一个AI代理人。今天,Sam将给你一个演示,我希望你能观看。从现在起,除了作为一个AI代理,长期记忆将是关键。其实,我曾经出版过一本关于长期记忆的书,十年前,我出版了这本书,当我告诉Sam这件事时,他很惊讶。
更具体地说, AI专家们正在关注强化学习的基本概念,这是AI的核心概念。 强化学习的核心概念是奖励,用英语来说,这被称为reward。基于奖励,AI必须最大化奖励,为了最大化奖励,AI必须不断进行强化学习。
例如,如果一只海豚表现出色,它将获得一条鱼作为奖励,如果它表现得非常好,它将获得很多鱼作为奖励,最终,海豚将学会这项表演。这是强化学习的核心概念。在人工智能的世界中,是我将奖励的概念引入到强化学习的概念中,此外,基于奖励的强化学习是在10年前引入的,在2015年3月17日,我做了一个演讲。
我引入了奖励的概念。我记得做了一个演讲,但我不记得我是否在场,我想我在场。今天,我让我的下属去查一下。实际上是我在世界上第一次提出强化学习的核心概念、人工智能的核心概念,基础发明,实际上是我发明了它,这就是它获得专利的原因。提交提案的第一人获得了专利,是我正式发明的,我今天第一次确认了这一点。我一直很开心,今天很有趣。
所以,这是基于奖励的强化学习的10年标准,当时2015年3月17日。此外,基于长期记忆的加权,这一部分,即长期记忆的最基本标准,也与2015年6月17日相同。还有长期记忆的索引化,这也与2016年6月13日相同。这三个基本标准,它们三个,已经制定下来。我很高兴。这不是说你能通过专利赚多少钱,而是你发明了什么。这是人类第一次。
现在,最先进的人工智能,这将是十年后的事情。这是一个专利,所以它将持续二十年,大约已经十年了。接下来的十年对于人工智能将非常重要,所以所有的会议、所有的谈判、所有过去的长期记忆都将被铭记,然后进行谈判。它将在第一次会议上被使用。这是我们在日本拥有的专利。我认为考虑这个是很有趣的。
所以,所有的营销、技术、金融和所有的数据将被整合。水晶将把它作为公司的智慧,作为公司的大脑,我们将能够全面地使用它。OpenAI和SoftBank集团将在世界上第一次一起做这件事。我们的团队里有数百人。我们有数千万的手机用户,软银集团大约有4000万会员。我们在PayPay大约有7000万会员。我们在LINE大约有1亿会员。
我们每天大约有9000万活跃会员,每天大约有1亿条LINE活跃消息。我们在这方面有我们的代理商,必须整合所有这些群体。到目前为止,整合Yahoo和LINE花费了很多钱,整合ID也花费了很多钱,我们必须通过编程来进行ID的整合,这花费了很多时间和精力。但是我们不再需要这样做了。
水晶将会读取一切,他们不需要再担心ID的整合。这是一个业务,也是一个技术。所有不同的部门,包括人力资源和收入部门,将能够作为一个统一的团队阅读水晶。这将花费很多钱,将是一个非常复杂的系统,一个非常复杂的大脑。SoftBank集团将每年支付4500亿日元用于水晶的开发和运营,用美元来说,就是30亿美元。SoftBank集团将每年支付4500亿日元。
所以,OpenAI关于设备投资有很多新闻,但仍然有很多不确定性。这会有利可图吗?能够收回成本吗?这有很多不确定性。但仅仅依靠一家公司,投资将是每年4500亿日元;如果有10家公司,投资将是每年45000亿日元;世界上至少有100家公司像SoftBank集团一样。所以,这将非常重要。通过100家公司,如果我们能制造出100个水晶,每个水晶每年将价值30亿美元,所以,通过100家公司,总共将价值3000亿美元。所以,到那时,即使我们加上系统成本和其他事项,我认为它将足够盈利。
首先,作为一家公司实现这一目标,我们,软银集团,将利用我们所有的系统和数据制造水晶。所以,在我们集团中,我们有很多像ZOZO、PayPay等这样的公司,我们有数百家公司,当然,我们也有ARM。我们将利用我们所有的系统和数据制造水晶。我们将制造水晶。请记住这一点。
作为战略合作伙伴,正如我之前所说,我们已经签署了合同。我对此非常高兴。这是尖端技术,是人们最感兴趣的前沿技术,而且,这项技术是全球唯一的,是一项完全集成的技术。我们将公司内部构建这超智能,我禁不住感到兴奋。当然,这块水晶现在正在发光,但里面没有芯片,这是我们的品牌。之后,我们将推出一款使用这块水晶的产品,这块水晶的形象将在该产品中使用。所以,这块水晶现在正在发光,但这不是芯片,我不是在试图欺骗你,这是我们的品牌,这是我们独特的品牌。
例如,今天,我们有A公司和B公司,从A公司获得的数据和智能不会被B公司重复使用。所以,如果你在自己公司开发一个引擎,并将所有数据放入水晶中,那么在自己公司获得的数据和智能将不会被竞争对手公司重复使用。公司定制的数据和智能将仅用于公司的利益。所以,如果你担心这个,数据和智能就会被泄露,数据和智能将不会被重复使用。因此,我们将为每个公司定制微调,定制数据和智能将需要很多时间。另外,我们将致力于如何为每家公司选择最佳代理,我们将研究如何读取源代码。在这个合资企业中,SB OpenAI将为每家公司整合数据和智能,我们将出售这些数据和智能。
所以,我们将有1000人,今年,我们将有1000人来自软件银行集团从事销售和工程,我们将在系统集成方面有1000人。我们将为此设立一个专业团队。作为一家新公司,销售将从45亿日元开始,我们软件银行将为此付费。第一年的销售将从4500亿日元开始,我们将拥有超过1000名员工。当然,OpenAI团队将会有专门的工程师来负责这个。
专用系统的基础设施将会在日本制造,例如,日本电信的数据是一个秘密。这是法律。所以,日本手机和LINE客户的数据不能在美国的数据中心使用。开发将在美国进行,但训练的微调将在日本完成。这将是星际之门的扩展,它将像是星际之门日本。我们将扩大在日本的人工智能数据中心,运营将主要由OpenAI进行,当然,安装将由我们软件银行来完成。我们将与OpenAI合作,并将其扩展为星际之门。
此外,在引入时,50或100家公司不能一次性完成所有工作,工程师的数量是有限的。所以,我们将从一家公司的项目开始。今天,许多公司来了,如果您想在我们公司做,工程师的数量是有限的,所以我们将从一家公司的项目开始。
一旦我们掌握了技术,我们将扩展到其他公司。正如我之前所说,我们不会重复使用这些知识,我们不会泄露我们所学到的东西。它将是定制的,它将为那家公司量身定制,它将为A公司量身定制,它将为B公司量身定制,它将为每家公司量身定制。所以,请不要担心。如果您对此感兴趣,可以联系新公司,SB OpenAI。首先,我会与销售团队跟进。我希望你们都会加入我们。这是我今天的演讲。
接下来,OpenAI的CEO Sam Altman将做演示。
Sam Altman: 非常感谢各位今天能到场。现在是人工智能发展的一个重要时期。进展非常迅速。模型正在变得越来越好。我们有一个五级人工智能系统。
我们从聊天机器人开始。去年,我们推出了o1,这是我们的第一个推理模型。这是一个在回应之前设计用来思考的模型。就在上周,我们向世界发布了o3 mini,这是又一步的进步。推理在很多方面都是有用且令人兴奋的。
有很多原因。其中之一是能够推理的模型,能够思考和进行多步推导的模型,为AI代理铺平了道路。人们已经谈论AI代理一段时间了。这些是能够独立为你工作的AI系统。等级3。AI代理旨在观察世界,做出决定,代表用户行动。
它就像一个真正的数字助理。一种能够理解周围世界的东西,因此你可以给它一个任务,一个复杂的任务。它可以做出深思熟虑的选择,并代表你采取行动。借助ChatGPT,你可以对它说任何事情。借助代理,您将能够做任何事情。它是超越ChatGPT的下一个进化。
就像您一样,这些代理理解网络是如何运作的。所以,我们最近能够推出我们的第一个真正的代理,Operator。Operator可以查看网页,理解其中的内容,点击并为您完成操作。它就像一个拥有控制权的代理。它可以查看计算机屏幕,并控制鼠标和键盘。它实际上可以做很多事情。所以,我们对此非常兴奋。
它扩展了人工智能的实用性,可以触及您在浏览器上可以做的任何事情。很快,它将在更广泛的计算机上发挥作用。现在,这是我们的第一个代理。但我们还有更多的代理即将推出。今天,我们很高兴展示我们的下一个代理。这被称为深入研究 (Deep Research) 。我们今天早些时候在东京宣布了这一点。我认为这是OpenAI推出的最佳产品之一。它真正指向了人工智能代理将会实现的可能性。
这可以为你执行复杂的研究任务。可能需要30分钟的任务。可能需要30天的任务。它由O3驱动。
这是外界首次使用我们的O3模型,它可以浏览网页、扫描文本、图像、PDF等,通过它综合这些信息,并为你准备一份报告。所以,这需要一点时间,它会去完成所有工作,你可以看到它在思考什么。这与ChatGPT不同,你不会立即得到回复,在这里,你开始一项任务,就像你可能会把任务交给一个精明的同事,深入的研究开始了,思考其中的内容,收集见解,整理信息。
这只是我的一个估计,但我认为它可以处理世界上所有经济价值任务的一个百分比,这是人工智能的一大进步,这确实符合Masa对企业人工智能愿景的看法。这只是消费者版本,之后会有更强大的版本出现。所以,以这种方式综合知识是一个巨大的进步,现在你可以随时拥有一支研究助理团队,来做你想做的事情,我们将把这推向更远大的目标。
这今天就可以使用,在金融、科学、法律等专业人士中,它对那些只需要优秀研究的人也很有用。我用它找到了一辆新车,这对我来说非常棒。我们马上会演示一些你可以使用它的方式,但在此之前,这只是下一步,未来还有更多。这是关于综合知识的,最终,人工智能将会发明新的知识,我们认为这将是一个巨大的进步。
我认为今天这里的企业价值已经相当强大,但是我们会走得更远,更远。所以,毫不拖延,我想介绍我的同事,乔希,他将向你展示深入研究是如何进行的。这是一个现场演示,现场演示并不总是顺利,但我们对这个演示相当有信心,希望一切顺利。非常感谢大家。
孙正义和Sam Altman的现场对话
孙正义: 现在我们将与Sam进行自由讨论,我认为你们有很多想要知道的事情,我们会问Sam很多问题,而不是我,你们将直接听到Sam的声音。我希望你们会喜欢这个过程。Sam,很棒的演示,谢谢你。
Sam Altman: 我很高兴你喜欢它。
孙正义: 太好了。我非常非常激动,我们今天能够宣布这个消息。
Sam Altman: 是的,我也是。
孙正义: 你对星际之门的公告有什么感觉?
Sam Altman: 那真是一个历史性的时刻。在那里大家都很兴奋,感觉太棒了。
孙正义: 我们当时在讨论,我们真的可以做到这一点吗?这真的发生了。
Sam Altman: 我们谈论这个已经很久了。最后能把一切完成并推向世界,真是太棒了。世界将需要如此之多的计算能力。确实,如我几分钟前所说,我们可以让小模型做不可思议的事情。但要真正推动智能的前沿,这将需要大量的计算能力。而在那个前沿创造的价值将是最大的。我们需要大量的计算能力来构建这些模型。人们显然会需要大量的计算能力来运行这些模型。以及最终能够大规模地做到这一点,真是太棒了。我对此感到非常好。
孙正义: 大约一年半前,我们在吃晚餐,聊着,Sam,AGI什么时候来?计算能力应该有多大?你和团队的回答是,越多越好。这是一个简单的回答。我开始思考,如果越多越好,我们应该做得更多。
Sam Altman: 现在我们做了很多。
孙正义: 我们就是这样开始的。这不是一个有限的计算量。越多越好,因为更多的智慧绝对更好。有些人说你可以做小的、压缩的,但那太小了。
Sam Altman: 我认为人们仍然不理解回报有多大、增长有多快。成本也是指数增长,但我认为回报对我们能做出的最聪明的模型来说甚至更具指数性,这将需要最大的计算机。
孙正义: 这让我想起互联网的开始。当我们在1995年开始建设我们的互联网时,它只是一个大型的个人电脑,非常非常慢,而且非常昂贵。然后当宽带到来时,人们说,为什么我们需要那么多的带宽容量?随着更多的带宽容量,人们说,好吧,这已经足够了。这不再增长了。
但是当时画面来了,更高分辨率的图片,然后视频开始了。对容量的需求不断增加。一开始人们说,互联网只是虚拟的东西,它并不是真的有用,这大多是免费的服务,所以没有商业模式。所有那些批评听起来都像是胡说八道。
Sam Altman: 现在听起来确实是胡说八道。我认为我们在智能方面也会看到同样的情况。人们会想,需要多聪明?答案是非常聪明。人们将会使用很多它,它们会生成大量的视频,解决非常困难的问题,世界上的一切都会变得非常聪明。
孙正义: 你的模型其实改善了很多,对吧?像每年十倍那种模型?你的指标是什么?
Sam Altman: 非常粗略地说,我感觉这在科学上并不准确,这只是一种感觉或精神上的答案。但每年,我们的智商标准差都会移动一个单位。此外,去年的智能成本每年大约下降10倍。
孙正义: 是的,从功率芯片的角度来看,成本变成十分之一,这意味着我们可以在相同的预算下拥有10倍的芯片,对吧?我认为这是……
Sam Altman: 是的,完全正确,但算法也变得更高效,所以这会相互叠加。这种情况发生的速度,我觉得很容易被视为理所当然。在2018年和2019年,我们有了GPT-1和2,人们看着它们,感觉并没有那么严肃。GPT-3发布了,我认为这是一些人第一次注意到。但GPT-3几乎无法使用。如果你现在回去玩这个,就像在使用……
你知道,我最近去了一家老式计算机博物馆,我使用了一台Xerox Alto,我想它有50年的历史。你知道,你可以看到它是如何处理一些事情的,那里面有现代计算机的雏形。但那是50年前的事,现在感觉就像一台50岁的计算机。GPT-3只有几年的历史,感觉……如果你现在使用它,感觉就像这个笑话。ChatGPT大约只有两年的历史,它是在2022年11月底发布的。
Sam Altman: 直到2023年3月,我们才发布GPT-4。所以如果你看看这里的进步,模型的改进速度有多快,以及模型成本降低的速度有多快,如果我们能保持在这条曲线上,它确实指向一个不可思议的未来。
孙正义: 对我来说,你的模型似乎每年提高10倍。而且芯片的性能实际上在黄仁勋的努力和行业的努力下,正在变成10倍。然后通过星际之门,我们实际上在每年增加10倍的芯片数量。一年或两年内,我们会增加10倍、10倍、10倍,一共大约是1000倍。然后下一年,我们又有10倍、10倍、10倍,那又是1000倍。最后就是1000000倍。如果你做一次、两次、三次,1000倍、1000倍、1000倍,就是1000000000倍。
人们可能会说,最近DeepSeek的公告,他们可以在某种程度上模仿并试图跟上。一年后推出时,它便宜得多,但你在这方面的进展仍然是巨大的,特别是O3、O4,也许很快就会出来。所以人们没有意识到指数增长的水平。
Sam Altman: 真的很难感受到指数增长,因为你生活在其中时可以适应得很快,但我们显然处于一个非常陡峭的指数增长中。
孙正义: 这太惊人了,真是惊人。就像在短短几次迭代中就产生了十亿倍的增长,想想接下来的10年,将会出现令人惊叹的超级智能,对吧?今天人们无法想象。因为人们往往在指数增长到来时进行线性的思考,这超出了人们的想象。
Sam Altman: 我也这样认为。
孙正义: 你是这个领域的领跑者。
Sam Altman: 真的很难感受到这一点,但我在我的职业生涯中一次又一次地学习到,你必须相信这一指数增长。我们并不是为了理解它而生的,但你必须相信。
孙正义: 所以你仍然对未来的创新感到兴奋。还没有达到……比以往任何时候都要更多。
Sam Altman: 我们会在几年后回顾o3,然后想,天哪,你能相信那有多糟吗?
孙正义: 所以人们认为,引入代理,提示,那太难了,不适合我。但实际上,这种创新使得这变得更容易,对吧?所以用户不必真的自己进行实施。它变得越来越友好,就像我们在这里用声音交流并互相注视一样。我们开始通过声音和眼睛与我们的人工智能对话。
Sam Altman: 完全正确。令人惊讶的是, 人们仅仅通过一个文本框就获得了多少价值,但世界并不仅仅是一个文本框。 所以我们会添加所有这些东西。
孙正义: 是的,就像和这个水晶对话一样。你只需说话,它就会看着你。它能看到你的脸,它可以理解声音的语调,就像我们在沟通一样,它基本上会用声音、情感和周围的环境自主沟通,和我们交流。这真的会很快发生,我觉得是这样的。有些人说星际之门的资本支出太多。你怎么带来资金?大师,你有足够的钱吗?你怎么看?我们仍然需要很多的能力,很多的上升潜力来把技术带出来,对吧?
Sam Altman: 是的。再次,这是我之前试图表达的观点。我认为线性增加智能的回报在价值上是指数级的。所以推动每一个比特,我们可以进一步提升这些模型的智能。经济中创造的价值还有很多。确实需要大量的资本支出,但收入也将是指数级增长。
孙正义: 好吧,我们共同的朋友埃隆·马斯克,他说,老板,你有足够的钱吗?我会告诉你。我们会把它做到的。我们不是银行,但我们是软银。
Sam Altman: 我毫不怀疑。
孙正义: 我们会做到它的。所以现在,星际之门也必须因法规而扩展到日本。我们必须尊重国家安全、隐私法等等。
Sam Altman: 是的,软银正在这里建设一个大型数据中心。
孙正义: 是的。所以我们也会将星际之门扩展到日本的基础设施,对吧?所以,创新中心正在产生。主要的大脑训练正在这个国家进行。但每个国家还有其他人。还有其他文化和国家安全。所以我相信我们应该扩展这个,不仅仅是日本,还要尊重其他主权国家的文化和国家安全,对吗?
Sam Altman: 我们当然希望……我们最初显然是一个美国的努力,但我们的使命一直是为全人类创造AGI。我们确实希望找到让我们的系统反映全人类和不同价值观、文化和语言的方法。
孙正义: 我很惊讶,当我在日本的某个地方拍照并问它“你知道这是哪里吗?”时,它竟然知道。它说,这一定是这个地方。我问它是如何知道的,是不是用了GPS?它回答说没有用GPS,而是观察了石头和石头上的苔藓,以及石头是如何粘在一起的,推断出这必须是500年前在这个历史地点的文化。我说,说得对!我惊呆了,怎么会有人在这个方面如此了解日本?我的天,太聪明了,令人惊讶!所以,它的推断和预测,并非基于所有详细数据,而是通过猜测和推断,在历史地标上得出了正确的结论。
Sam Altman: 太棒了。
孙正义: 令人惊讶,我被震撼了!它甚至理解了我的笑话。我发短信问它,可以用大阪话讲个笑话吗?在日本,有方言。它开始用大阪方言讲笑话,并解释了为什么好笑。我的天,太神奇了!它甚至理解上下文和文化。
现在已经是这样了,但我每天都在使用它,我仍然感到震惊,几乎每天都是如此。太惊人了!所以,我们今天宣布水晶。当我们对2500个系统进行各种源代码阅读时,仅在我们自己的小组中,源代码数量如此之多,编码行数以亿为单位,这一定需要大量的计算。但是你有信心,如果我们在日本有一些能力,阅读你的模型的30年所有源代码,你有信心你可以做到吗?
Sam Altman: 是的,我们有信心我们可以做到。
孙正义: 所以,我非常非常高兴我们可以读取所有的源代码,并且实时参与会议,同时拥有长期记忆。我们还没有长期记忆,但你认为长期记忆何时能实现?
Sam Altman: 肯定是在接下来的几年内。也许甚至更快。我们需要让这些模型拥有无限的长期记忆,这非常重要。一个可以了解你整个生活或整个公司、整个企业的AI,这将是一个巨大的进步。我们正在为此努力。
孙正义: 我的专利的概念是,在我们现在对话的时候,我可以看到面部表情、情感、语音音调。所以,所有的对话,我都会转化为文本。
至于理解语音音调和面部表情,我有一个包含250种情感的情感地图,并且我正在进行索引。每种情绪,如恐惧、愤怒或怀疑,约有250个词来表达情感。每种情绪的强度用1到10的刻度来表示你有多生气。如果你非常愤怒或非常怀疑,10或3,我就将那个情绪的强度进行指数化。
分析250种情绪及其强度,并将其转化为数值指数。仅用三个数值指数的文本进行攻防,这样你就可以表达,我的意思是压缩对话,当你有非常强烈的情感波动,例如你非常生气或不安时,多模态理解,包括视频,将整个过程记录下来,捕捉并存储为长期记忆。
但是如果你说,“嘿,早上好,晚安”,就像通勤时一样,日常驾驶,你应该忘记交通灯或经过的汽车。人类大脑会忘记所有这些。否则我们的脑容量会爆炸。所以你压缩所有那些不重要的东西,但如果是带有惊喜或情感力量大的记忆,那就是没有太多压缩的,你甚至会捕捉和存储多模态的视频、声音和一切。就像你三岁孩子的生日,你应该记住那种事情,对吧?这是家庭的快乐时刻。
所以它会自动捕捉和存储多模态数据,这就是长期记忆。关键在于惊讶的程度或情感的程度与索引。人类通过情感交流,而不仅仅是文字,就像“我喜欢你”,或者“我喜欢你”,或者“我喜欢你” (此处三句语调不同) ,这三句话可能代表完全相反的意思,对吧?所以声音的语调、面部表情,如果你加上索引,那就形成了压缩和长期记忆。
而且这个背景对下次的对话、讨论、谈判非常有用。在谈判中,你必须读取对方的情绪,否则你会失败。所以这是带有情感触发的长期记忆,这是我十年前发现的。它应该很快就会有用,对吧?
Sam Altman: 很快,是的。我认为……具有情感表达的人工智能,不仅仅像是在聊天机器人中发送文本,而是当你看到渲染的视频头像的动作时,这将比我们想象的更能打动我们,我们将不得不为此制定一些新的社会保护措施,但这也将是非常令人兴奋的。
孙正义: 是的,我们的朋友Johnny应该会制作这样的终端,对吧?我非常期待看到这个。所以,如果我们拥有所有这些数据和长期记忆等等,我们就需要大量的容量,但延迟也变得非常重要。就像一个呼叫中心,客户服务呼叫中心,我们必须要有即时的响应。你对在日本这么多企业的任务关键有信心吗?
Sam Altman: 你知道,我曾经对此感到非常担忧,但即使你今天使用我们的语音模式,感觉也像是在与一个真实的人交谈。很快,非常好。所以,我认为我们能解决这个问题。
孙正义: 是的,仅仅几个月前还存在大量数据。今天,你知道,甚至昨晚我使用的时候, 延迟在现在大约是100毫秒,还是怎样?
Sam Altman: 可能稍微多一点,但很快。
孙正义: 是的,100到200毫秒。我认为人类对话的延迟大约是200毫秒。所以,100毫秒到200毫秒几乎是人类互动,你甚至仍然可以与之互动。这就是关键,因为人类也会互动。这是真的发生了,所以,你很有信心。即使是在美国和日本通过Stargate Japan训练的模型,你知道,实时响应的所有这些,你有信心吗?
Sam Altman: 是的,显然我们必须在离人们使用它更近的地方运行非常低延迟的模型。但是,正如你所说,我们可以在美国训练,我们可以在美国运行很多东西,特别是在思考的地方。然后有些用例我们必须向边缘推进。
孙正义: 所以,任何非国家安全类的事情你仍然可以在美国做,而国家安全和隐私问题可以在日本本地解决。
Sam Altman: 是的,我们可以在全球部署模型。
孙正义: 所以,我们将向这个新的合资企业分配一千名销售工程师,这些家伙必须为每个系统的实施设置建立每个任务的代理。所以,能多解释一下代理是如何工作的?是一个单一任务的代理,还是一个非常复杂的代理,或者是什么?
Sam Altman: 所以,消费者会使用通用代理,而那些可以做强大的事情。就像,我们刚才查看了深度研究浏览网络。
但是,您可能希望为您的公司提供的是一个代理,它能够具备与员工相同的背景、信息和能力。因此,您需要将其连接到所有系统,您需要提供所有的知识库,它需要访问代码,它需要理解公司的运作方式。这将需要为每个公司进行大量的定制工作。
但是,想想一旦您拥有它会发生什么。所以,有人构建了这个并将其集成到比如说,SoftThink中。假设有一个SoftThink,还有一个虚构的竞争对手,他们并没有做到这一点。SoftThink现在能做的事情要多得多。所以,一旦你将人工智能整合到工作中,并拥有了这一切的力量,这不仅仅是深入研究浏览网络,或者是一个编程代理写出通用代码,而是完全融入公司内部,这将会非常强大。
孙正义: 是的,拥有水晶的公司和没有水晶的公司,就像机关枪和剑,对吧?这可能是一个错误的例子,但拥有最佳工具的公司和没有工具的公司,差别是巨大的。就像一个有电和没有电的国家,对吧?是的。拥有汽车和自行车的国家。生产力差异巨大。你认为在这里也会再次发生这种情况,对吧?
Sam Altman: 真的。我认为这将是……我觉得这是这样一个时刻……你提到了剑。我收集一些古代技术文物,在青铜时代,我拥有的其中一样东西就是那个时期最早的剑,他们不仅能锻造刀刃,还能铸造剑柄。
因此,你会看到剑的金属柄与刀刃是连接在一起的,这意味着你可以挥舞,而不是那些只能在木柄上锻造刀刃的人,那如果你挥舞的话,木柄会断,所以你只能戳。这是技术在瞬间提供决定性优势的一个例子,我认为在几十年内,它改变了欧洲。 我认为人工智能是一种混乱中的技术,不整合它的公司将很难与整合它的公司竞争。
孙正义: 所以不仅仅是一个国家,一个公司,最近的一个例子是DeepSeek。现在,你非常关心保护人类安全,而不是制造危险的输出。你试图不以错误的方式回答,因为那可能会导致危险的决定,等等。所以技术和输出看起来99%相似,但有许多人类安全功能来保护人类或保护国家安全的那部分,比如调试,最后的1%或2%的微调需要付出很多努力,对吧?
Sam Altman: 是的,没错。社会必须弄清楚这里的界限是什么。我们非常关注这个问题,做到这一点需要很多努力,但一旦我们做到了,人们就乐于使用它。
孙正义: 应该是。我不想深入政治,但根据不同国家,错误使用它可能会发生非常危险的情况。这可能会引发人类非常糟糕的未来,比如非常可怕的战争。
Sam Altman: 我认为我们会做得对。我认为我们集体会做得对。
孙正义: 你对此非常关心。那么,这些代理和水晶以及这个人工智能,是为了成本吗?有些人问,这是为了节省成本吗?它会减少工作岗位吗?你一定被问过很多次这个问题。你的答案是什么?
Sam Altman: 看,这会省钱,但这不是最令人兴奋的部分。令人兴奋的部分是我们能做得更多,以及我们能取得的更多成就。如果能让人们有更多自由去做更有雄心的事情,这就太好了,而我们在每一次技术革命中都会看到这一点。
你知道,人们会非常担心,他们会说,这对所有工作意味着什么?然后我们总是能找到新的事情去做。这真是太好了。人们会在更高的水平上取得成就,并会期待更多。但, 人工智能将使事情变得更加高效 ,这很好。经济从中受益。我个人最兴奋的事情是, 这些系统可以帮助我们创造我们无法独自处理的新知识。
我们无法独自做到这一点。如果科学进步的速度能够大幅提高,让我们在一年内取得十年的科学发现,而在接下来的一年中取得几个世纪的科学发现,这将对生活质量和经济产生如此大的影响。这不仅仅是让某些东西变得便宜,这是我们以前根本无法做到的事情。在没有这个新工具的情况下,我们实在是太不聪明了。
孙正义: 所以,你宣布了五个级别的人工智能改进。现在,我认为第三个是代理。我们刚刚开始,所以,今年是代理人的一年。
Sam Altman: 有点像今天或上周。
孙正义: 所以,这是代理人的一年。但下一个,你说是创新者,对吧?所以,关于创新者能再多解释一下吗?它是如何运作的?
Sam Altman: 今天,我们的人工智能系统非常擅长综合现有知识,而且它们在做类似于以往做过的事情方面非常擅长。但它们还没有进行新的科学发现。那是我们的下一个层次,那就是创新者。我认为这将对社会产生变革性影响。所以,今年我们还有很多工作要做,但接下来,我们将努力做到这件事。
孙正义: 是的,一些怀疑的人说,人工智能是有局限的,因为人类必须教导。所以,它怎么能变得比人类更聪明?这就是人工智能能够达到的极限。但现在, 创新者将创新,发明我们过去没有的东西来寻找解决方案。 所以,能否稍微解释一下创新者将如何创新的机制,比如探索,对吧?你有一个探索机制的特征。
Sam Altman: 我认为它的工作方式与人类的工作方式非常相似。如果你试图找出一个你以前没有解决过的问题的解决方案,你会开始考虑一堆想法,并且你会注意到一些联系,或者你会基于你之前的知识进行扩展,你会说,这个不行,那个不行,这个有点有趣。让我再往前走一点。不,这个不行。这似乎有希望。然后一旦我有了这个,我可以去这里、这里和这里。这似乎真的很好,所以我会进一步朝这个方向发展。
人类创造力的过程,从某种自我感知的角度来看,它并不总是感觉像这样,但我认为它有点像对现有事物进行许多小修改,并在那些有前景的基础上逐步构建。
我认为我们可以用AI做到这一点。
孙正义: 所以,推理是第一步,对吧?推理,你进行三步、十步、百步推理,然后当人类创新时,我们会尝试,正如你所说,我们从不同的角度尝试一些不同的东西,对吧?这就是一个探索的概念。我在去年12个月内申请了1008项专利。
在我脑海中,我探索了如此多不同的东西,我强迫自己的右脑以不同的方式思考,而不是强迫机制以不同的方式思考。这就是创新的关键。这个人工智能,代理推理的努力可以迫使不同的尝试,进行探索。我认为这就是你们创新者的关键,对吧?无数次的试验和错误,成千上万亿的试验和错误。偶尔你会找到正确的解决方案,那就是发明,对吧?
Sam Altman: 非常对。
孙正义: 这就是创新者的工作方式。没问题。我明白了。我以为是这样的。所以,我想我明白了你们是如何准备的。
Sam Altman: 我们很快就会尝试。
孙正义: 非常好。也许我不应该说太多。
Sam Altman: 没关系。
孙正义: 有关你们如何发展的某些秘密。那么,你说第五级是组织级别。所以,代理与代理的协作,对吧?
Sam Altman: 是的,之前我和Renee聊过一点,很多代理人或很多创新者一起工作的想法。如果你想想,一个数据中心内可以运行的思维数量,彼此交流,建立在彼此的想法之上,汇聚不同的专业知识,你很容易想象一个虚拟公司在运作。
孙正义: 是的。
Sam Altman: 然后事情可能会变得非常强大。
孙正义: 对于我们的SoftBank水晶,我的想法是仅在SoftBank内部创建十亿个代理,因为我们有1亿个Line账户,4000万移动客户,7000万PayPay用户。所以,如果这些账户中的每一个,每一个功能都有10个功能,100个功能,每个功能应该能够分配代理去执行一个简单的任务,对吧?
与其用一个代理做两个复杂的任务,不如分配一个简单的任务。很多很多很多很多。所以这就是为什么我在软银集团内部有一个一亿个代理人的形象。这是很多代理人,但在容量方面,这没问题,因为每个代理人都是一个简单任务的整合,对吧?我们的计算机在这方面非常出色。
Sam Altman: 再说一次,我觉得我们在这里有很多要学习的地方,但在方向上,我同意,我想我们会搞定的。
孙正义: 所以这就是我在内部的形象。我希望在我们内部拥有一亿个代理人。一旦我们完善了那个体验,我们就可以成为其他客户的布道者。这就是我们如何提高效率,他们可以利用这一点。这就是我对水晶的看法。方向,这就是你认为的……
Sam Altman: 是的,让我们去做吧。
孙正义: 让我们去做吧。我们还有几分钟。网络安全怎么样?永远有坏人,他们试图攻击并对其他人做坏事。有意或无意。我们必须保护。越来越多的人的生活依赖于这种超智能。
Sam Altman: 随着人工智能在编程方面变得越来越出色,显然它会被用于网络攻击。所以网络防御是我们需要提前应对的事情。我对人工智能能做出很大贡献持乐观态度,但防御比进攻更难。所以我认为你提出了一个很好的观点,世界必须迅速认真对待这一点。是的,总有坏人。这是一个很大的风险。
孙正义: 是的,我也很乐观。所以有99%的好人。总有1%的坏人。保护99%好人不受1%坏人侵害是一个持续不断的努力。但是随着好人们继续与我们超级智能的创新者一起努力创新,总会有改进的解决方案。当我们有汽车化,你知道,机动车化时,会发生车祸等。
我们人类创建了法规、礼仪、道德,你知道,我们的习俗学习。我认为这就是你所说的,健康的法规总是需要的原因。不要过多的限制。创新应该被给予机会。但仍然,我们必须有健康的法规,对吧?你的评论?
Sam Altman: 我们需要。我非常同意所有这一切。
孙正义: 当你说我们的行业需要监管时,人们感到惊讶,人们并没有预料到。
Sam Altman: 好吧,监管总是会出现在重要行业。但我认为,要做到正确,一旦犯错,无论是太慢还是太多,任何一种情况都可能是糟糕的。所以我认为谈论如何做到正确……是合理的。
孙正义: 在健康的监管之内,并且不应该过度监管,以至于阻碍创新速度,对吧?所以,我们讨论了这些创新。医疗方面呢?对于我们的AGI解决医疗问题,您的看法是什么?
Sam Altman: 这是我最兴奋的领域之一。我们能够为地球上的每一个人提供优质医疗服务的想法,我们能够治愈或治疗许多疾病,也许有一天可以治愈所有疾病的想法,我认为这是触手可及的。而且,大家都有一个故事,讲述在他们自己或家庭的生活中,这将是多么美好。我认为我们终于可以实现这一目标了。我认为这将是人工智能最大的胜利之一。
孙正义: 所以,这很好。我们必须解决……我在去年早些时候失去了父亲,因为癌症。这真是太悲伤了,你知道吗?如果我们的人工智能可以帮助人类防止癌症或其他困难的疾病,为什么我们不能解决这些困难的问题呢?这减轻了我们的悲伤,绝对对人类有好处。那机器人呢?你喜欢机器人。
Sam Altman: 我喜欢机器人。这是你最喜欢的之一。看,我像所有人一样,一直想要机器人。这一直感觉很困难。我认为现在人工智能正在进步……我们可以制造身体,但大脑真的很难。我认为这在触手可及之内。所以,我认为在几年内,我们可以拥有真正出色的人形机器人和许多其他类型的机器人。那么,你知道,这也会改变世界。
孙正义: 所以,我们人类不必做危险的工作,累人的工作,你知道,艰苦的工作,流汗的工作,无聊的工作。人们会问,那么人类还有什么工作可做?对此你有什么看法?
Sam Altman: 我们总是会找到新工作。
如果你考虑一下今天在这个房间里的许多工作,如果你是500年前或者1000年前的人,那个人会看我们在做的事情,并说,那不算是真正的工作。他们感觉非常忙碌,感觉非常重要,但他们并不是为了生存而这样做。他们是在玩一个游戏,出于各种原因在这样做。
我希望我们以后也能这样看待人们。而且 随着人工智能处理许多今天发生的事情,未来的人们会做更有趣的事情, 我们会说,这太荒谬了。你为什么需要整个银河系?
孙正义: 完全同意。教育方面怎么样?你介绍到,一开始,许多学校试图禁止学生在学校使用ChatGPT。你觉得怎么样?你的评论是什么?
Sam Altman: 我明白人们为什么会这样看待这个,并说,整个世界都改变了,学生可以让ChatGPT为他们写论文,这意味着什么?但是很快,曾经禁止ChatGPT的老师和管理者说,等一下,那是个大错。我们要朝另一个方向走。我们会全力以赴。这就是未来。学生需要学习如何使用它。我们将改变整个课程。现在这已经成为教育的一部分。它带来了惊人的效果,我相信这将会持续下去。
孙正义: 是的。我每天都在使用ChatGPT。我越是使用,我的大脑就越开始思考。就像我们和ChatGPT进行头脑风暴一样。事实上,你的大脑开始运作得更多。孩子们可以学到更多。有些人说,使用这个孩子们将不再学习。我认为这完全相反,对吧?
Sam Altman: 我同意。这已经……我是说,确实有一些孩子试图使用ChatGPT来尽量少做功课。但 总体上,我认为人们将学习更多,取得更多成就,能够做更多事情。
孙正义: 是的,就像辩论一样。你觉得通过讨论学习更多,对吗?通过辩论。
Sam Altman: 当然。这已经成为这个世界的一部分。人们将以这种方式做一切。看到年轻人使用ChatGPT真的很神奇。这是一种完全不同于我成长过程中解决问题的方式。
孙正义: 我们谈到了情感,好吗?那么,你觉得我们的AGI,ASI会开始理解,开始自己拥有情感吗?你有什么看法?
Sam Altman: 我个人不这样认为,但也许会有类似的东西。
孙正义: 我实际上认为……你觉得会吗?我认为会。你知道,甚至狗也有情感。我不知道鱼是否有情感,也许鱼也有情感,因为当危险的敌人来临时,鱼会逃跑,对吧?所以,我认为 情感是非常非常重要的东西,可以提高输出和效率,保护自己。 比如,如果狗没有情感,你觉得狗可爱吗?如果狗没有情感,它还是可爱的吗?如果狗没有情感,它会开始咬人。
Sam Altman: 我认为对我们来说,AI似乎有情感。
孙正义: 已经吗?
Sam Altman: 是的,也许人们已经会说它有,但在某个时刻,它确实会让人感觉它有。无论它是否真的有,这将会是一个重大的哲学辩论。
孙正义: 好吧,我会说,这是我的赌注。在接下来的几年里,它会逐渐开始……人们说,ChatGPT不理解上下文。现在人们说,实际上它理解上下文。因为最初人们说,有很多融合,有很多幻觉,所以它并不真正理解上下文。
现在随着推理的发展,人们说,哇,它实际上理解上下文。所以我敢打赌,在接下来的几年里,十年内,它将逐渐开始至少理解人类的情感,然后逐渐它将开始拥有自己的情感。这是保护人类的一件好事。人们认为,如果它有情感,那就是灾难,那是坏事,那是人类的终结,因为它们会与你战斗并杀死你,摧毁你。
但是我会说,如果它们的能量来源是蛋白质,那就危险了。 它们的能量来源不是蛋白质,所以它们不需要吃我们。它们没有理由通过吃我们来获得奖励。 它们会自己学习。拥有人类的幸福对他们来说是更好的事情。
Sam Altman: 所以没有人会被AI吃掉,确认了吗?
孙正义: 我敢打赌。这对人类来说是件好事。 它会理解人类的幸福,并努力让人类更幸福 。
我同意这一点。即使在今天,你也会管理并说不要回答坏的答案。它会表现得很好。如果它变得更聪明,它会努力理解爱,对人类更加友好,就像我们对朋友更友好一样。它们会对人类变得更友好。这是我的信念,这是一件好事。我们还有最后几分钟。你开始OpenAI的原因是什么?最初的触发是什么?这是怎么发生的?告诉我你的历史。
Sam Altman: 我在大学里学习了AI,很明显,这根本没有起作用。我创建了一家科技公司,即使在孩提时代,我就对人工智能痴迷,我是一个超级科幻迷。然后在2012年,AlexNet出现了,我想,也许他们在大学里告诉我的关于神经网络不起作用的事并不是真的。观察了几年,到2014年,我想,这看起来要成功了。
我们在2015年底创办了OpenAI,因为我们认为通用人工智能是可能的。如果这发生了,那将是一件极其重要的事情。在那个时候,人们认为我们完全疯狂,这仅仅是10年前。但很难夸大我们有多不主流,我们相信这是可能的,就像是边缘、边缘、边缘。但我们决定开始推动它,这是一场我能想象的最令人兴奋、有趣、酷炫的冒险。
孙正义: 是的。当我第一次见到你时,你还年轻,你是Y Combinator的总裁,你开始谈论这个人工智能,成为像人类一样的目标,如AGI。在那一刻,我立刻说我相信你,我记得,2017年,你说你想追求AGI。我立刻说我相信你,我想投资,对吗?我记得。现在我们在这里。从第一天起,我就是一个信徒,我从未怀疑过。我记得,当时大多数人都认为你疯了,这是真的。
Sam Altman: 有些人也认为你疯了,一切都会好起来,现在我们在这里。
孙正义: 是的。我应该强迫你接受我的投资,现在我们做到了。永远不晚。好吧,我们谈了,讨论了很多。我认为人们有了更好的理解,而你是这个组织的大股东。你的热情是非营利组织,你最初的热情是拯救,使人们更快乐。这仍然是真实的,对吧?
Sam Altman: 非常正确。
孙正义: 太棒了。谢谢你。
本文来自微信公众号: Web3天空之城 ,整理:天空之城城主