AI 时代,为什么「智能体」将成为第一入口
作者 | Li Yuan
编辑 | 靖宇
大模型技术进展一年后,真正的杀手级应用目前尚未出现,而其中一个被人广泛为人预言的方向,是大语言模型成为未来 AI 时代的第一入口:我们不再需要点开单独的应用,而是把所有交互交给一个由大语言模型驱动的智能助手,它理解我们全部的个人偏好,了解所有个人数据,我们依靠它来调用应用,满足所有需求。
这样的智能助手,需要满足个人隐私需求,也需要更便宜的算力支撑,很难依靠云端算力来完全完成,更需要新的 AI 硬件来支持,许多先行者也正在为之努力。11 月 9 日,Sam Altman 投资的 Humane 正式推出了 AI Pin。而 12 月,又有消息表示,Sam Altman 正在联合 John Ive 招募前苹果员工设计新的 AI 硬件。
这样全新的硬件或许离量产还很远,但是,通过对目前的智能设备增加大模型能力,为当前的工作流设计的 AI 智能助手,实际上已经距离真正进入我们生活很近了。
许多手机厂商,目前已经在布局,将 AI 大模型的能力,融入自己原有的手机助手中,而作为「AI PC」产业的引领者,联想也在开发基于本地大模型的个人智能体,将其布局到自己的 AI PC 和其他终端中,推动 PC 进化为个人 AI 助理。
2023 年 12 月 26 日,联想公布了其 AI PC 概念中的关键一环——个人智能体的进展。联想面向开发者发布了个人智能体小乐同学,并开启了智能体小程序开发者招募计划。在未来,小乐同学能够通过自然语言交互,调用本地大模型、云端大模型以及 AI 应用,并结合个人知识库,洞察用户个人偏好,从而成为用户与 AI PC 交互的第一交互入口。
来源:联想
个人智能体 成为第一入口
自大模型能力成为焦点之后,智能体的前景一直广受业界关注。相比于大模型驱动的聊天机器人,只能被动回复用户需求,智能体拥有一定自主性,能够感知、规划、决策并执行相关任务。
个人智能体基于内嵌于终端的本地大模型而打造,当收到用户请求后,本地大模型会精准理解用户意图,并将意图转换为相应的任务组合,分解任务并识别任务完成的路径,从而进一步查询本地知识库、调用设备 API、调用合适的模型或应用来执行相应的任务。设备、模型或应用执行完成任务后,会将相应的结果返回给智能体,智能体完成整合后再反馈给用户。
11 月的发布会上,OpenAI 就做了一个类似个人智能体的功能的演示。在开会前,只需要与 GPT 助手对话,就可以让 GPT 直接读取自己的日程,添加会议日程,同时直接给同事发短信,提醒开会。
GPT 的功能是利用了云端插件完成的,这样的操作必然涉及到将用户的日程、通讯录等等都交由云端管理,而个人智能体,则依靠用户本地算力和本地数据,即可完成这样的操作,有着更强的隐私保护属性,也更适合企业办公等不便上云的场景。
目前,各家硬件厂商,都已经纷纷开启了相关的尝试。在 PC 端,联想则是第一个提出相关设想的公司。
在 10 月的 Tech World 上,联想就已经看到了未来个人智能体的发展机遇。
在 Tech World 上,联想展示了 demo 阶段的 AI PC 上的个人智能体,能够和云端大模型一样帮助用户解决出行行程规划问题。而个人智能体的优势在于,可以结合用户的的本地信息——家庭地址、酒店偏好等,生成个性化行程,同时整个过程完全不用上云,不侵犯用户的个人隐私。
除了保护隐私之外,与云端模型的能力相比,个人智能体还有很强的对硬件的控制能力。如在传统的电脑中开启「省电模式」,需要在数千条系统设置中,找到类似于电池的选项,翻阅到特定选项卡下,进行多次点击才能触达这一设置。而对于个人智能体而言,只需要一句「帮我打开省电模式」即可。
在过去,人们在数字世界的操作总是不连贯的,通常也需要对于软件拥有足够多的认知,才能进行熟练操作。
正如 OpenAI 的演示中展示的建立日程,通知同事开会的场景一样。人类在头脑中,建立日程,通知同事,甚至进一步地将订票信息添加到备忘中,实际上是一气呵成的。而在现实生活中,我们的操作却往往是割裂的。
来源:视觉中国
建立日程需要打开日历应用,为会议添加背景信息。通知同事则需要打开通讯应用,再一次编辑同样的背景信息发送给同事。如果涉及到外部人员的沟通,可能还需要打开更多的应用来完成。而为此次会议订票,添加订票信息到备忘,每一步也都需要更多的操作。
这样的操作,也通常需要对于每个应用都足够熟悉。即使一个人再精通科技,如果某些交互和设定不是该用户的常用路径,迷失在应用的图形界面也是常有的事情。
而大语言模型作为「世界模型」,拥有对人类世界的常识和自然语言交互能力,能够自主分解目标和调用工具,一旦搭配上个人习惯的数据库,就能真正很好地辅助人类,甚至代替人类完成这样的复杂操作,成为用户自己的「个人智能体」。
「个人智能体将成为大模型、终端与用户之间的全新桥梁,重构未来的 AI 应用生态。」联想集团副总裁兼中国区战略及业务拓展副总裁阿不力克木·阿不力米提(阿木)表示,「个人智能体将为用户创造下一代 AI 体验,让用户再也不愿意回到今天的传统体验。」
AI PC,个人智能体真正落地的战场
随着芯片能力的进展,目前很多 PC 产品已经开始官宣其将 AI 能力加入了硬件产品中。
2023 年 12 月 15 日,联想也正式官宣了 ThinkPad X1 Carbon AI 、联想小新 Pro 16 AI 酷睿版两款产品,是业内首批搭载 Intel 酷睿 Ultra 处理器、配有全新 AI 专属芯片 NPU 的产品,标志着 AI Ready 的 AI PC 产品落地。
采用混合 AI 架构,新的 AI PC 能够利用 CPU+GPU+NPU 三种硬件支持大模型能力,为 PC 带来设备级的 AI 算力支持。
来源:视觉中国
但是联想的野心不止于此。联想将 AI PC 定义为两个阶段:AI ready 阶段,PC 能够基本具备对 AI 任务更具针对性的本地混合 AI 算力,使 AI 软件能够更快地处理数据和任务,这对于一些如语音识别、图像处理等需要实时响应的 AI 应用尤为重要。
而 AI PC 的完全体要到 AI On 阶段:AI On 阶段的 PC 以个人智能体为核心特征,能够实现端边协同计算、跨设备互联接力,成为每一个人的个人 AI 助 理。
在 12 月 26 日的联想天禧 AI 生态伙伴大会上,联想公布了自己的个人智能体的研发规划。
具体而言,在联想的天禧 AI 生态中中,联想的个人智能体——「小乐同学」,收到用户请求后,会调用本地大模型,精准理解用户意图,并将意图转换为相应的任务组合,综合调用本地和云端的大模型,找到合适的相关应用进行解决。
比如,如果用户想要做的是「打开电脑省电模式」这样的简单设备操作,模型会调用主机本身的设置,帮助用户完成相关的操作。
而如果用户想要做的,是解读一本长篇巨著,系统则会提示,是否需要接入联想合作的云端大模型来帮助更快解决这样的问题。
而如果用户想做的是帮助优化某个 PPT 的版本,则系统则会考虑调用一个个人智能体生态中的应用,帮助用户进行 PPT 的优化。
类似这样的外部应用,联想目前开始针对开发者进行合作,希望借助更多创新性的「智能体小程序」,让小乐同学更加智能。
此次小乐同学的发布宣传片,我们能看到联想在个人智能体上的初步能力:不但可以完成前述的自然语言对于控制电脑的设置,完成云端大模型常见的问答和多模态生成。除此之外,个人智能体还可以调用应用内部的设置,例如在联想的宣传片中,未来小乐同学可以根据电脑的配置和玩家所玩的游戏,智能提示设置电脑的帧率,甚至通过多模态的能力,分析目前游戏的进度,提示玩家目前的游戏应当如何进一步选择战略进行操作。
「比如当你要出差时,小乐同学会将『出差』这个需求,拆分成订机票、订酒店、安排接送机等多个任务,你不再需要逐一费心,小乐都可以帮你来解决。」联想集团副总裁、联想中国区消费业务群总经理张华提到小乐同学的未来能达到的助理能力时表示。
联想集团 副总裁 、联想中国区消费业务群 总经理 张华 | 图片来源:联想
虽然各大科技厂商都在进行相关布局,但是,通过电脑上的个人智能体,或许我们将更早看到端侧大模型成为生产力的加持。
从算力角度,PC 是迄今为止最强的个人计算平台,兼具强算力与便携性的平衡。虽然手机端目前也可以运行较小的大模型,但 PC 兼具多核 CPU,还拥有专门的 GPU 和 NPU,能够更好地为大模型提供算力。
「根据负载,AI PC 可以去调度不同性能的核,选择高性能或者超低能耗的核。GPU 可以去负责做本地大模型的一些推理和简单的调优。」英特尔中国研究院院长宋继强在联想天禧 AI 生态开发者大会的圆桌论坛上表示,「NPU 则可以在系统休眠的时候,做外设管理,智能化的平台能力支撑。」
其次,从数据角度,PC 作为生产力工具,本身就拥有许多用户的工作文档,也是设计、编程等许多工作无法转移的平台,存储着大量涉密无法上传至云端的机密文件。对于在意文档的机密性的个人和公司而言,PC 端是最适合使用个人智能体提升生产效率的终端。
个人智能体,或带来未来的 OS 革命
个人智能体,可以被视为未来一个新阶段的设备级的入口。
一旦用户发现与个人智能体的交互体验,使用个人智能体调用应用内的功能,优于直接进入割裂的应用程序进行操作,个人智能体将成为数字世界的第一入口。
阿木表示:「在这次 AI 浪潮下,新的 OS 操作系统将是 AI 大模型、个人智能体以及本地知识库调用、AI 原生应用连接的服务形态,是一次全新的 OS 升级。
联想集团 副总裁 兼中国区战略及业务拓展副总裁阿不力克木·阿不力米提(阿木) | 图片来源:联想
「我们与联想在这方面是非常高度共识的。」爱设计&AiPPT.cn 创始人赵充在联想天禧 AI 生态开发者大会上表示,「这一个 AIGC 时代,整个操作系统是被 AI 重新改造的,所有的应用都应该再做一遍。AI 能给用户带来代际差。」
个人智能体的未来,最有可能率先在 AI PC 中实现,不过,一旦它的潜力得到验证,它对生产力和个人效率的提升,最终一定会使得它进入多个终端。
「AI PC 将会以引领终端 AI 算力的角色,推动全新一代 OS 下的创新。其他终端很快也会补齐承载 AI 算力的能力,逐渐形成真正意义上的 AI 终端生态。」阿木提到。
未来的软硬件世界,也都将因此产生许多变数。
例如个人智能体本身,可以智能帮助用户设置硬件的选项,调整配置。拥有个人智能体的硬件设备,能够为用户带来更好的体验,影响用户对于硬件的选择。个人智能体也可能自动基于用户的使用,为用户推荐合适的硬件,将硬件销售融入到用户的使用过程中。
随着个人智能体学习到越来越多的用户个人数据和习惯,个人智能体或将成为用户在数字世界无法离开的数字孪生体,这也将影响到用户的换机选择。
在电脑端、手机端、平板端、物联网设备端,或许会出现越来越多的个人智能体,而能够达到跨端融合的厂家,或许也将在这样的竞争中处于优势地位。
比如已经有些科技公司在大模型出现之前,就已经产生了良好的物联网家居生态。个人智能体出现之后,用户对于全屋智能的控制将更加完善。
一个个人智能体了解用户的全部需求,能够让用户获得手机、平板、PC 之间的接力,也可能变成用户生活和办公越来越离不开的体验。
而在这方面,拥有多端设备的联想,也颇具优势。12 月 26 日的联想天禧 AI 生态伙伴大会上,联想还发布了自己的「四端一体」战略,未来联想的个人智能体,将穿梭于四类 AI 终端,最大化地提高用户的效率。
来源:联想
比如联想新发布的超级文件,就可以联通手机端和 PC 端。未来,用户在手机端接受了某个文件,只要在 PC 上对「小乐同学」说,把刚刚的文件总结一下,个人智能体就可以完全对此进行理解,并直接帮助用户将手机端的文件进行处理。随着大模型技术的进展,这样的跨端协同功能,必然成为用户换机的重要考虑。
「AI 手机、AI 平板会伴随使用者的日常生活,管理并提供生活所需的各种应用。至于 AI 换机,它对所有设备都很重要,能让你的新设备,瞬间变成老朋友。」张华表示。
发展了一年的大模型技术,到目前为止尚未出现一个杀手级应用。下一个杀手级应用是否将出现在 AI 硬件上?个人智能体是否能够颠覆原有的生态格局,产生新的应用流量入口?2024 年,正是许多报告中预测的 AI PC 元年,个人智能体的潜力能否在今年释放?答案值得我们期待。