因为去年几次给行业「降温」的言论,最近小冰公司 CEO 李笛被人打上了「看衰大模型」和「AI 旧世代」的标签。
李笛有点无奈,「去年火了以后这个行业就是这样。一开始是夸大模型厉害,后面光夸不够你得说自己信仰大模型;更后面说信仰都不行,你还得用若干辞藻堆砌来表达你对大模型的热情,才是个现代人。」
2 个小时的访谈里,他几次提出希望我们不要用「大模型时代」来形容这股浪潮。他认为技术的发展趋势不会是一条一直向上的斜线,而会是经历一波又一波的周期。2013 年就开始做 AI 的李笛和小冰,已经经历过 AI 的几个周期。
在他看来,大模型给 AI 带来了一个新的波峰,而不是开启了一条新的曲线。
近日,小冰公司宣布已经成功获得「小冰大模型」国内备案,包括小冰克隆人、歌手克隆人分支等在内的一系列测试产品静默期结束,转为正式发布。这些产品在过去半年的测试中积累了数十万的创作者用户,但都不是所谓的大模型原生应用,而是在原有的产品上利用大模型的技术能力对一些关键环节升级,从而提升了用户的使用体验。
对行业周期的认识一定程度上成为了过去一年小冰的大模型「行动纲领」。比如在产品上,小冰不会一味追求所谓的「大模型原生」;比如在经营上,小冰不会为了提升短期关注度而去卷热点,甚至会在市场教育还没完成的时候就先考虑「自限」,规避 AI 可能造成的伦理风险;当然在言论上,李笛也更加保守。
过去一年,这给小冰似乎带来的更多是一些「坏处」。不卷热点和参数,让小冰少了一些爆点,也成了部分人质疑他们是旧派的依据,一定程度上也让他们没那么容易拿到以热钱为代表的行业红利资源。
但李笛依然认为这种冷静是必要的,他说小冰不去追热点,不去为了流量做一些事情,其实是早年已经踩过或者看人踩过同样的坑。
「流量会带来关注和热钱,但这个行业其实不缺少这些,真正需要解决的问题是找到长期可持续的商业模式。」
而一味追求流量、热点和热钱,比如去卷榜单、做开源或者追热点,只会让商业模式变形。
所以当我们提到最近行业谈论比较多的「卷应用」,他其实是有一点担心,但不是怕做不过别人,而是担心大家把卷的地方搞错,最终卷坏了 AI 应用的市场环境。
为此,小冰有一些自己的准备,比如做 C2C 平台去避开可能出现的免费和补贴打法。但李笛自己也坦言,可能内卷和行业趋冷都是无法避免的。
但李笛也没有我们想象的那么焦虑。他告诉我们,小冰的目标从创业至今一直是做 AI Being,这会是 AI 真正的 killer App。从 2013 年开始时用的 Retrieval Model,到后面的生成模型,再到今天的大模型,小冰一直在用技术推动 AI Being 成为现实。
「我希望
AI Being
在这波大模式技术范式的更新下,能够真正落下来成为
killer App
,如果没有,我们会接着做,直到下一波技术浪潮来临。
」
以下是对话全文,由极客公园编辑整理。
李笛:
大概从 2011 年与苹果 Siri 同一个时期,微软开始做 cortana 和小冰两个方向的智能,相当于一个往智商去,一个往情感这个方向来。当时的技术没有办法同时在情商和智商上做到兼备,所以当时我们用两个产品形态去包装他。
在这个过程里面,我们当时就发现一个问题,如果你想要跟用户之间建立一个 long-term relationship,也就是情感纽带关系,需要让与人类交流的 AI 个体具有多样性和个性化,即「千人千面」。
为了实现这一目标,我们开始将小冰转变为 AI Beings,通过框架去支撑各种各样的人工智能。我们最初称之为 AI Beings,后来国内有很多其他的概念,包括数字人的出现,我们就更多地用「克隆人」这个名称。
在 2017 年,我们开发了许多工具和自动化系统,以帮助我们和用户去创造各种不同的 AI Beings。
2019 年我们开始做一个叫做 project kalalu 的项目,这个项目代号是叫 kalalu,当时没有在中国做,在日本做的。它主要的特点就是用大模型技术,小样本去驱动 AI Beings 的 personal knowledge,从而迅速获取大量信息。
到 2020 年的时候,实际上我们当时手上就已经有一个很不错的 GPT-2 模型。但是由于大模型的安全性在当时有很大的问题,所以我们只是把它放在了海外,没有在国内上线。到 2021 年,我们有了一个 GPT-3 的模型,但是规模不大。
李笛:
在 GPT-3.5 发布后,我们较早地了解了其相关信息。当时行业里面有几个判断:
但我们对此持有不同的观点。
一旦要进入到应用和产品落地,大家就会很快地从一味追逐模型参数规模的不断提升,变成反过头去布局中等参数规模和相对比较小参数规模的模型。基于上述判断,我们的「克隆人」项目更多就是布局中模型和小模型上。
1. 类似于 ChatGPT 的产品,与过去如 Cortana 或 Siri 等语音助手相比,它们的能力更为强大,但这一大类产品目前面临的主要问题是同质化竞争严重,且距离商业化还比较远。
2. 采用新技术范式的产品,它们可能不依赖于大型语言模型,而是在新技术范式下进行迭代,比方说利用 devotion based model 去做像妙鸭这样的工具型产品,或者是其他数据型的产品。
3. 还有一类是延续了传统的聊天机器人形态,主要针对网文受众群体,提供剧情浓度高的角色扮演(roleplay)服务。这类产品也有很多,可能二三十个。
我们的「克隆人」项目比较大的不同
——
它不是
2C
的产品,而是
C2C
的平台。
换句话说跟小冰以前一样,只是采用了新的方法,允许用户通过平台提供的工具来克隆自己,包括将个人的生物学特征、知识以及创造力数字化。
用户可以将这些数字化的「克隆人」有偿分发给他们的受众或粉丝群体,让它的粉丝群体在这使用它的「克隆人」,然后把相应的商业价值回输到这个平台,再由平台将收益分配给提供「克隆人」的原始用户,这样一种 C2C 平台模式目前在行业中还相对较少。
第一,必须得有足够多的供应,得有很多人在这儿能够提供这些「克隆人」。
这次的技术范式的革新最大的特点是把门槛降低,在 2018 年的时候做一个网红或者明星「克隆人」大概需要花至少 6 个月,并且本人要配合我们做很多的工作,那么现在其实就非常非常容易了,这样一来供给侧的问题就解决了。
第二,你需要去对齐提供这些「克隆人」的提供者,他们提供的「克隆人」和用户两端的需求。
从 7 月份开始我们经过了很多实验,现在基本上可以得出一个结论,如果我们只是把一个超大规模参数的大模型放在一个对话界面后面,即使是全球范围内目前为止最好的大模型,我们实测看到的用户端的反映效果还是不行的。换句话说,它还是要依靠一个相对比较完整、复杂的框架体系,以及多个不同的服务来贯通、支持它。
第三,用户的付费意愿,
你得确保这是一个叫好又叫座的平台。
在我们的实测中,用户的付费意愿有这么几个特点:首先用户愿意掏钱,所接受的支付 range 是从 1 块到 198 块,我们看到后台的分布数据是很漂亮的,我们对这个情况是比较满意的。
极客公园:在小冰克隆人项目里面大模型起到了什么作用?
李笛:
在可见的未来不存在一个叫大模型的产品。应该存在的是,在一个已经存在的产品或者有雏形的产品中,有一部分使用了大模型技术。这是一个非常明确的事。
第一,在预训练效果良好的大型模型基础上,可以采用更快速的方法来实现「克隆人」的个性化分化,做到千人千面。在过去,要实现这种分化,需要构建大量的知识图谱和生成模型,要做很多类不同的领域,要打上万个标签,然后才能把「克隆人」分化出来,然后后期维护也很难。以前它的创造要很长时间,现在会很短,后期维护的复杂性也简化了。
第二,在大模型之前,我们的做法还是使用 rule-based 这种方式,就是说你通过专家经验,你建立很多规则,然后你用这个规则去推动这个信号在这个环境里面去传递。但是在大模型之后,你可以专门拿出大模型来去做这种自我判断,让信号基于大模型的自我判断来推动,这种自主判断能力是之前的方法所不具备的。
极客公园:看到有一些头部的创作者,好像已经实现了一些比较不错的年化收入。接下来您对小冰克隆人项目的商业化是怎样去思考的,除了刚刚提到的一些方向,还有哪些方向会先落地?
李笛
:很多人都在想 2C 的 AI 的产品是什么,很可能我们在各方面数据上是到目前为止最接近商业化的一个。我们现在最基本在做的事情,是增加更多符合用户需求的功能,同时让「克隆人」本人也能参与到训练过程中,从而增加更多的 SKU,也就是增加更多可以商业化变现的玩法或特征。
还有就是拓展「克隆人」的类别,我们正在拓展一些知识类型和实用性类型的「克隆人」。
另外,我们打算把一部分训练「克隆人」的能力开放给平台上的所有用户,这样让更多的人有机会把自己克隆出来。这个可能不是平台希望的一个玩法,但是很多用户希望能有。
来源:小冰
极客公园:如果说开放给更多的用户,给普通人的话,技术滥用的风险是不是也会有所上升呢?
李笛:
没错,其实最早开始担心这件事的人是小冰,我们老是在行业里面扮演这种冷静的泼冷水的角色。这次仍然是这样的。
第一,目前为止在小冰的平台上,要想制造一个「克隆人」,必须要经过很复杂的流程。我们和每一个我们开放能力给他的「克隆人」的本人,都有很复杂的纸面协议,以确保他有充分的授权,或者确保他有充分的权利可以完成这件事。将来我们开放给普通人的时候也会有一系列复杂的验证过程的。
第二,从「克隆人」的发展角度来看,尤其是从商业的角度考虑,理论上不应该限制其在哪个平台上使用,但我们还是设置了限制,即必须在小冰的 X eva 这样的平台内才能使用。这样的限制虽然影响了 C2C 平台的开放性,但大大提高了安全性,减少了电诈等风险。
但是很遗憾的事情是,行业里面因为这次技术范式的变化,准入门槛降低了,且有大量开源资源放出来,很多人都可以参与进来了,那么必然会出现的情况就是,电诈等不良行为会增加。
极客公园:面对刚刚您提到的这些可能的风险,您觉得会有哪些比较好的规避的措施,或者说小冰会怎么来规避?
李笛:
小冰在行业里一直属于自限型选手,我介绍一下我们怎么规避的。
第一,其实如果从安全的角度和从行业的良性发展的角度来讲,开源是一个不好的行为。要知道,全球范围内,每年有超过 50% 的黑客攻击并非由具备黑客技术的人发起,而是由于一些工具被简化后公开发布,很多人就能够轻易地使用这些工具。
这当中分两部分人,一部分人是好玩,或者是正当的善意用途,还有一部分人附带了自己的商业诉求和一些不好的诉求。显然,后者的动机更为强烈。当这样的工具开源时,它面向的是大众,而对这个需求更强烈、更敏感的群体是坏人,因为用起来有「利」可图,他就会倾注更大的力量去运用这些工具。
开源协议是一个防君子不防小人的协议,他本身就是在做违法的事情的话,他还会管你的开源协议吗?
第二,业务拓展和业务开展还是要在尊重个人权益的基础上展开。比如说我们非常清楚的知道,如果在对话系统里或者声音系统里面包含了一些很受用户喜爱的知名 IP,当然流量会高,也会有一些社会热点,得到行业关注、投资人关注。但这些是需要先去获取授权的,如果未经 IP 所有者同意就这么搞,是有问题的。比如说最近很火的一键跳舞的视频,有人做了马斯克版本的视频,但没人问过马斯克是不是同意。
第三,在获取数据的过程中,需要取得明确的审核和审批,这也是一个非常明确的事。这里不只是指政府的审核审批,而是指内部要跟数据提供者得有一个强对话关系,得能够直接的和数据提供者建立关联。我们必须得直接和数据提供者确认这个数据它明知是因为什么原因提供,我们才使用这个数据。
极客公园:您提到小冰会进行一些自限,但这会不会导致小冰输掉竞争,也就是我们常说的「劣币驱逐良币」?
李笛:
确实就是这样。今年 2、3、4 月份,这个行业到一个什么状态呢?一开始有人说大模型好棒,后来你说大模型很棒都不管用了,你非得说我信仰大模型,才显得你是 Smart 的。再到后来说信仰大模型都不行,必须得用若干个堆砌的辞藻来表达你对大模型的热情,才像是一个现代人。
我们就不太愿意这样,因为你如果按照这种方式去声称,我们发自内心又不觉得应该去卷大模型规模,我说的跟我做的不就不是一回事了吗。
但是反过来头来,劣币会不会驱逐良币,是有可能的。这个前提是什么?客观来讲,我们认为我们是良币,前提是我们这个良币也还没有形成一个很强大的自我,也还没有形成非常 strong 的商业模式,也还没有成功。所以我们就有可能在通往成功的道路上被劣币驱逐了。
为什么我们又不愿意去做那个劣币呢?是因为我们知道那个劣币它也不能成功,过去很多次追热点的人全都失败了。如果我现在去做劣币,我的成功概率是很小的,因为没有哪个劣币它的成功概率会高。但是如果我坚持做良币,那么我的成功概率还更高,所以还是应该做良币,还是应该坚持做我们所判断的事情。
李笛:
之前有人和我说,你们也去刷榜,我说去刷榜基本上就是卷,你按照那 10 个维度调整大模型,最后调出来就是所有人都差不多。我可以拒绝刷榜,我就不刷,这是我们自己做的事情。
行业里面,因为大模型的投入是巨大的,所以它也不可能烧很久。上半年很狂热,下半年其实就已经有些人冷静下来了。应该是去年年终的时候我们有说过,到今年一季度的时候,基本上这事差不多就是可以有一个相对比较一致的观念了,现在正好是这个季度,大家也都开始回过神来了。
那我们现在认为的问题是什么呢?
问题是当所有人都开始意识到这个问题的时候,他不再去卷我们认为错误的那个方向,它有没有可能来卷我们认为正确的方向呢?用错误的方法来卷正确的方向,这是可能的。
我们现在做网红「克隆人」,我们是 C2C 的平台,不排除如果大家都觉得别的地方发现都不行了,然后卷过来,是不是也会开始大量的做补贴?也有可能的。
极客公园:那怎么办?真卷到那种程度的话,大家开始搞补贴了,小冰会怎么办?
李笛:
还是那句话,你看小冰这么多年,我们说我们是长期主义者是真的,我们也没变,别人来卷,我们就想各种办法来存在,别人不卷,因为这个市场从来不缺热点,又会冒出一个新的热点,他们就可能卷那个新热点了,那这也是我们所希望的。
极客公园:接下来聊聊另外一个主要的产品
——X Studio
。比如说从技术上,这个唱歌技术跟传统的
VOCALOID
有什么区别吗?
X Studio | 来源:小冰
李笛:
传统的 VOCALOID 使用的是音素拼接技术,这种技术通过手动采样和组合声音特征来生成音频流。这个过程类似于使用乐高积木,每个声音单元都是预先确定的,因此听起来可能有其固定的模式和限制。
你如果只有这些积木,你就只能拼成这样的旋律。而歌曲的演绎,包括说话的声音等等,它的每一个切片,都有可能是独一无二的,所以你就不太可能用乐高积木的方法把它拼接起来。音素拼接技术必然要被人工智能的技术取代。
极客公园:小冰的唱歌功能一直都在,什么时候开始决定说把这个能力平台化,去做成项目?包括这次为什么选择与网易云音乐合作?
李笛
:当时是这样的,关于小冰的唱歌能力要走无参数还是有参数方向,迟迟没有确定下来。
这个区别类似于比如说打开美图秀秀修一张图片的时候,你是更倾向于点一键美颜,还是你是更倾向于美图秀秀给你提供很多的功能,让你可以进行各种各样的微调。这个就是所谓的无参数和有参数的区别。
前者可以实现门槛的降低,后者可以实现对精细化的追求,可以提高上限。曾经的技术没有办法同时兼顾这两个方向,我们后来选择了通过 X Studio 这个工具的方法来实现后者,也就是你可以得到一个工具,这个工具可以让你进行各种方向的调整,这个就是 X Studio 的起源。
但是在新的技术范式下面,X Studio 又能够把两个东西合在一起了,既可以直接实现无参数的生成,也可以在无参数的生成的基础之上再进一步调整。
然后我们跟网易云音乐的合作,是因为网易云音乐在音乐人的社群方面有很好的沉积。我们作为一个技术方,非常希望和开发者,具体到音乐领域也就是音乐人能够产生更广泛的联系,这样的话也能够让我们去更好地迭代技术,以符合创作者的需求。
极客公园:刚刚您提到无参数和有参数,如果从后台看的话,用户更倾向于用无参数还是有参数,这个有一个比例吗?
李笛:
这个很有意思,大部分的用户其实还是回到我们以前的判断,也就是希望无参数尽可能足够好。但是对于专业音乐人来讲,有参数也是一种自我救急的方法。
举个例子,比方说特定的对于某一个段落,或者某一句,他有特定的要求,完全无参数的话,他也没有办法去很好的调整。有参数的话,他就可以用工具来进一步地去实现自己的想法。
极客公园:你观察
AI
歌手的消费用户群体是怎么样?与之前的虚拟歌手相同吗?
李笛:
你说的这是一个特别好的话题。虚拟歌手和 AI 歌手其实是有一个用户群上的区别的。这也是 2017 年的时候我们跟洛天依的粉丝之间的一个争议点。很多虚拟歌手的粉丝当时的观点是,如果我要听像人的声音,我就听人的歌了,我听虚拟歌手我就是听他不像人。
那么这个观点现在已经越来越基本上算是确定了,还是要像人,大多数人还是倾向于去听接近人的这种演绎风格,追求非人声特性的还是小众。
那么
AI
歌手的特征还是趋向于大众化,而非小众化。
第二,从音乐作品本身这个角度来讲,人工智能所产生的音乐作品和人所产生的音乐作品,在很长一段时间里面,仍然会有混同。因为音乐作品本质上来讲,实质上目前为止是一个供大于求的关系,如何去分配流量就变得很重要。
如果就那么一些好听的歌,谁做都可以,要流量平台分发没有意义。所以 AI 在这个里面更多的体现的其实不是歌曲本身,而是通过人工智能歌曲演唱的能力,来形成 AI 这种新的歌手,他就不能只是光唱歌,他必须像一个歌手一样,而不是像一个歌手的唱片一样。
极客公园:这次洛天依的加入,小冰的技术给她带来了什么样的变化?
李笛:
这个变化就是它既拥抱了新的技术潮流,同时又保留了原有的特征。
极客公园:前面您说到之前提到的大家不要卷参数,要落下来。但是也有一个问题,比如说通用大模型的能力如果越来越强的话,小冰现在做的事情会不会有这种被取代的风险?
李笛
:这个里面有一个误解,大家觉得我们说通用大模型不要去这么卷,所以我们就没有参与其中,我们就和通用大模型是一个硬币的两面,其实不是的。
第一,通用大模型接着卷参数,不会产生新的
surprising
,所以你不要再卷更大的参数,而是要去考虑你的大模型的差异化是在什么地方。
我们在几个月之前就说了,通用大模型在那么大的参数规模下,它对于预训练的数据的要求,它的数量要求会非常巨大。你的训练方式也差不多,你的训练数据也差不多,你对齐的对象都是 GPT4,或者 GPT3.5,这么多的大模型出来,当然会同质化,不太可能会拉开差距。
在这个过程里面,是第一个去投入这个技术,还是要等待这个技术相对更完善的时候,再适时地去使用,当然是后者更好。
第二,我们当时有一个判断,很快大规模参数的通用大模型将逐渐缩小与中等规模参数模型及小模型之间的能力差距。
换句话说,以前很多人认为在模型参数规模上有一个泾渭分明的界河,比如有的人把这个界河定在 100b,那么 100b 以上的和 100b 以下的就有明显的不同,这个明显的不同只是在当前技术范畴内它客观上存在的不同,不是理论验证的不同。现在事实上是十几 b 的模型,或者小几十 b 的模型,也具备了一定的通用能力。
可以预见的事情是,在最近这几个月的时间里面,这件事情会更容易发生。如果着急忙慌的用一个一定会内卷的方法,去追逐一个规模巨大的模型,而不是去搭建一个差异化的模型,那不是浪费了时间和金钱吗?
回到你的问题,在可见的未来,我们认为这一次的技术浪潮基本上创新差不多就达到这里,现在的重点其实是你要先假设没有新的技术突破(必须得这么假设),然后研究如何把已经展现出来的技术突破落下来,把它可行化。
在 GPT4 出来的时候大家就已经知道了,GPT4 没有什么新能力涌现,这就意味着 150 米外的那个红灯它就是个红灯,大家就看到那就是个红灯,为什么还会有人去踩油门往前冲呢?因为他会赌他到那个地方的时候,红灯又变绿灯了,就是又突破了,然后再接着往前冲,他在赌这个,所以他会去这么做。
这个坦率讲是有一定的可能性的,但是这个可能性发生的概率非常的低,因为这不太符合科学规律。
科学地讲,技术变革很少会在很短的时间内经历一飞冲天,更多是拉锯式地进行的,就是说会突破一下,然后释放出一些新的创新,然后又卡住了,然后再尝试。
极客公园:所以说在这种竞争当中,小冰具体接下来会怎么去应对呢?
李笛:
我们去年 2 月份确定我们的重点是
在假设新技术不会再继续有新的突破的情况下,如何把现有的模型把它落下来。
一方面是如何提高现有模型质量,另一方面是把模型对接或者把它迭代到原有的产品结构中,而不是一味用它去替换。
新技术有它的优点,有它的缺点,老的技术也有它的优点,有它的缺点,那么如何把它们很好地耦合在一起,就是我们在做的事情。
极客公园:你会怎么定义在接下来
AI
的发展当中小冰的角色?
李笛:
小冰一直没变,行业里面说人工智能不行,小冰也还是在做,行业里面说人工智能行,小冰也还是在做。小冰一直在做的就是一件事「造人」。什么样的技术合适,什么样的技术是符合我们去造人的,我们就用这样的技术去造人。
我们在 2013 年开始造人的时候,我们所掌握的技术是 Retrieval Model,我们就会把 Retrieval Model 做到极致。后来生成模型技术出来了,我们就用这种技术去造人。大模型出来了,我们就用大模型去造人,所以我们一直没有变过。
AI 少女小冰 | 来源:小冰
行业有很多人工智能的企业是做技术输出的,所以当它的新技术输出如果不能跟上的话,它的技术输出就不复存在了。
但是小冰从来不是做技术输出的,我们输出的是我们所封装的产品形态,也就是所谓的
AI Being
。
小冰还是跟整个人工智能这个行业不太一样,最基本的原因就是,
今天这个行业里还没有出现已经确定成功成立了一种产品形态的人工智能(包括小冰在内)。
举个例子,大家当年觉得 AlphaGO 会颠覆很多东西。但是到今天为止 AlphaGO 的产品形态没有了,它慢慢也就淡出视野了。之前 IBM 的 Watson 在医疗领域也是曾经很被看好,但是现在也没有了。智能音箱,曾经认为被认为会是一个中枢,也没有了。ChatGPT 刚出来的时候,大家会认为它会是一个通用的超级入口,现在也不是的。现在很多人在追的陪伴型 AI,这个很快也有可能会被证伪。
到今天为止所有的针对人工智能的
2C
的产品,历次的尝试都没有成功。
那么这个事情还没有定的时候,根本没有形成一个业态的时候,这个位置怎么排?可能人们就会以谁是现在的热饽饽来排。
但那其实没有意义,热饽饽每年都有。所以我们相对比较冷静一些。
极客公园:
ChatGPT
用户已经破亿了,它也算不上成功的
2C
产品吗?
李笛:必须要在能够持续拥有这个用户群体,并且在持续拥有用户群体的情况下,找到产品的商业模式,然后让这个商业模式能够完整的持续的运行起来才可以,才算得上是成功的
2C
产品。
举个例子,对于 GPT 来讲,它现在所面临的问题是 20 美元和用户心理预期之间的对标是怎么样的,以及它最后收敛下来的用户群体究竟是一个小众的用户群体,还是一个真的人人实时都需要的这样一个用户群体,以及它的收费是不是能对抗各种免费的冲击。
我感觉没有人认为 OpenAI 的 GPT4 所形成的技术壁垒是存在的,同样我也相信没有人认为国内任何一个大模型公司,它的大模型的壁垒是存在的。
极客公园:大模型时代的
killer App
会怎么产生?
李笛:在人工智能时代,
AI Being
就是那个
killer App
,我一直这么认为,如果我不这么认为我就不会一直做这个,做这个很辛苦
。
我希望它在这波大模式技术范式的更新下能够真正落下来成为这个 killer App,如果没有,我们会接着做,直到下一波技术浪潮来临。
大模型本身不是一个时代的代名词,它是一个时代中间的一次技术范式变化的代名词。
这个很容易混淆,当人们混淆的时候,人们就会把它和大模型之前的技术进行对抗。
李笛:
在实际使用大模型的时候都能看到,大模型的可依赖性是不够的,
最本质的原因是
transformer
这种结构,是在做相关性,并不是真的在做因果。
因果是什么?因果是一个有方向的,它是一个向量,比如说因为 A 所以 B,反之因为 B 所以 A 不一定是成立的。在大模型来讲,更多的还是在衡量 A 和 B 之间是有相关的,所以它的预测是以相关性的方式来进行的。
在评估和使用这类产品时,一个显著的特点是,人们往往抱有测试者心态,大模型技术确实会回答的非常漂亮,所以人们就会被 surprise 到。
可依赖性的问题是什么?是在你不知道答案的情况下,你不知道该不该信它的。在这个层面上,如果大模型在因果上面不能得到一个明确的判定的话,那么几乎可以认定它就是不可信的。因为即便有 99% 的成功率,99% 的可信率,也会存在 1% 不可预知的很荒谬的错误。
同理,为什么到现在为止我们绝对不做心理咨询方面的工作,因为如果说我是 AI 的咨询师,无论我用多么认真的方式对齐我的价值观之类的,我都仍然有可能在某一个特定的案例下面,真的劝一个用户「要不然你就结束生命吧」。
我可能可以做到 99.999% 的成功率,准确率,但是当我的并发足够高的时候,只要我有一例这样的情况,我就会造成一个生命的消亡,那么你整个业务模型就会崩塌。大模型的这个问题很可能需要下一次技术浪潮来解决。
极客公园:接下来小冰的
AI
应用更多会
ToC
还是
ToB
?
李笛:
我们在 2020 年的时候跟微软有一个联合的发布会,当时提过,在人工智能时代,至少我们所处的领域其实不太有 B 和 C 的概念,ToB 和 ToC 的概念是过去 20 年左右逐渐形成的,在那之前其实也没有。
人工智能有一个很大的特点,就是它重交互,重生成。所以对于我们来说
不管是
ToB
还是
ToC
,最终归根到底是
ToC
的,区别在于是直接
ToC
的,还是通过
B2C
的东西
ToC
。
所以我们始终站在 ToC 的角度上看待这个问题。包括我们做数字员工,也会把数字员工和用户之间的交互视为一个 ToC 的交互形态,不会只是把任务完成,而是会包含很多情感上的交流,建立比较好的交流关系。
然后我们倾向于尽可能的直接到达 ToC,ToB 也是我们到达 ToC 的一种途径。这是小冰的一个特征,我们不会只想做一个解决方案提供商。
极客公园:现在的国内环境下,出现一些什么样的变化能有更多的原生性的创新诞生?
李笛:
我觉得大家都没钱了就好办了。因为背后有人把钱给你扔过来,所以他就希望你要做各种各样的事情。一个 NLP 的博士刚毕业,实习经验没多少,300 万的年薪,这个是不合理的,而且对博士本人的职业生涯都是不合理的。为什么?就是因为这 300 万的年薪不是博士的价值,这 300 万年薪是融资成本。
所以热钱的这种不理性,其实是其中的一个非常大的问题。
极客公园:近来几个月大家都在开始讨论
Agent
,你怎么看
Agent
这个方向?
招商局集团 AI 数字员工招小影 | 来源:小冰
李笛:
小冰在 2013 年底立项的时候,我这个团队的代号叫 social Agent。后来我们认为 Agent 这个概念不太容易被理解,所以才把它改成叫 AI Being。
Agent
是
AI Being
一种特化的描述,而
AI Being
相对来讲更泛化一些。
在 2014 年的时候,实际上比尔·盖茨曾经写过一篇 memo,我们在微软内部的时候还参与了。这个 memo 就是到底 Agent 如何去定义,如何去构建,只不过当时的技术不太 make sense。
所以你问我说认为 2024 年,或者大模型浪潮面前有可能产生真正的落地的产品是什么,我跟你说是 AI Being,你也可以把它理解成大家所说的通常所说的 Agent,
就是一个能够像人一样深入植入和融入人类工作、生活的方方面面的存在,它能够和人结成一种新的大社交图谱。
极客公园:那你怎么看
Agent
这个概念在今天的火热?
李笛:
任何一个概念出来,在硅谷那边有人说了以后,这边就会有一堆人说,元宇宙的时候也是。
问题在于一堆人都在说
Agent
,我们先要对齐每个人说的
Agent
是不是同一个
Agent
。
有的人说的 Agent 指的就是在 workflow 中承担某一个特定的一系列的角色,或者是助理的角色,或者是有的人认为办公软件里面,可以帮忙总结出群聊会议纪要的角色,这个就是 Agent——不同的人对 Agent 的理解是截然不同的。
所以
Agent
现在跟当年的元宇宙的很像,基本上变成一个筐,啥都能往里装。
极客公园:它会跟前面您提到的一些产品形态一样很快出现,又很快消失吗?还是说它有一些不一样的可能性?
李笛:
这个比较有意思,由于这波大模型,特别是在参数规模比较大的大模型上,其实更多的它展现出来的还真不是情商部分,更多的是智商部分的提高。
所以在 2024 年,甚至于到 2025 年,很多人的 Agent 更多尝试都会在所谓的企业协同、办公协同这个领域。但是在这个领域更多的是协同,当中一个很重要的原因就是因为你没有办法去信赖 Agent 独立完成一件事情,更多是会让 Agent 不停地给你提供一些原始材料,节约你的效率,而不是取代你的某一个节点。
我们真正希望的 Agent 是可以独立完成一个节点的,而不是在每一个节点上都仍然需要人来进行确认
。
极客公园:关于
AI
行业整体的发展,
2024
年您会有一些什么样的看法?
李笛:坦诚地讲,一个是
2024
年
AI
的行业发展会有方方面面的趋冷,过热之后一定会走一个很明显的下滑。
而且很多人现在不在国内做产品创新了,普通社会大众在 2023 年的时候已经被灌输的科幻的不能再科幻了,聊天机器人这种形态可能都要退出市场了,大众可能都会对聊天机器人这五个字会产生生理性厌恶了。
另一个是确实在 2023 年有一些企业融到了很多钱,所以它又不得不去做一些工作,做一些事情,在这个过程里面,可能就会引发一些新的内卷的行为,其实这些内卷的行为已经在发生了,只是在 2024 年它可能会更明显一些,这些行为也可以理解为一种企业自救行为。
极客公园:大家都在说
2024
年卷应用的阶段来了,小冰属于比较早就在开发应用了,在圈内又开始卷应用这个阶段的话,会感到压力增加吗?
李笛:
你知道 2023 年的时候我为什么决定做 C2C 的平台,不做 2C 吗?
做 C2C 意味着我们的每一个用户都是付费用户,我们不提供免费服务或者去依赖广告和电商转化。这跟开始讲的 AI 也截然不同,AI 进入市场通常会吸引一大堆免费的用户,大多是不会付费的。
也正是因为做 C2C 的平台,在别人过来卷的时候,他们不太可能用免费的方法来卷。你要是过来免费的方法来卷,你跟创造者怎么分成?你分不了成,最多用补贴的方式来卷。
但是所有其他 2C 的平台,接下来卷的话可能也就是免费,毕竟这也已经是一种肌肉记忆了。我们是已经很努力的在提前规避,这种卷免费的打法。
极客公园:在这两年里有感到压力感比较强烈的时刻吗?
李笛:
我们的压力更多的是来自于我们能不能坚守自己,因为现在各种声音太多了。
不过更重要的事情还是我们整个行业到底能不能找到一个新的商业模式,真的有一个很好的产品形态,这个产品形态可以真的发挥作用。
而不是人工智能浪潮一波一波地起伏,所有人不过是在其中得到一些收入的变化,如果是冲着这个其实没必要非得来做人工智能这么苦的一个事,这个行业是很苦的,没什么乐趣可言,说实话,有时候遇冷多过乐趣。