百度,来势汹汹

虎嗅网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

出品 | 虎嗅科技组

作者 | 房晓楠

编辑 | 苗正卿

头图 | 视觉中国


4月25日,在Create2025百度AI开发者大会上,百度发布了文心大模型4.5 Turbo和深度思考模型X1 Turbo两款新模型。较之文心4.5,文心4.5 Turbo速度更快,价格下降80%。


其实此次距离文心4.5和文心X1的发布才刚刚过去一个多月,模型短期内多次迭代,与之相对应的“应用”价值是否会被覆盖?创始人李彦宏的看法是,找对场景、选对基础模型、会调模型,做出来的应用就不会过时。

 

李彦宏演讲中多次提到应用,甚至断言,“模型有很多,但统治这个世界的是应用。”


此次,百度也发布了多款AI应用产品,包括一款官方定位为通用超级智能体的心响App。


据研发团队透露,这款产品是一支95后年轻团队在30天左右交付的结果,而正式开发是在3月18日。从时间推断,这个时间距离Manus亮相过去12天。


智能体来势汹汹。如果说去年关于大模型的落地应用还是处于悬而未决的试探阶段,那3月初Manus的爆火,直接给出了一个明确而具体的答案,应用是未来,AI智能体的喧闹前奏已经响起。


不管是对于大厂,还是初创企业来说,DeepSeek式的冲击与带来的措手不及,一次就好。这次,必须快速响应。像是字节,据媒体报道,在Manus出现前后,内部大概有7个团队在开发不同的智能体产品。


如今,初创企业中Genpark发布了Super Agent,大厂中的字节和百度相继推出新品,其他玩家也在蓄势待发。这一年,注定是AI智能体喧哗热闹的一年。


在心响App正式发布前,虎嗅等媒体事先进行了产品体验,同时也与百度智能体业务首席架构师、心响App负责人黄际洲,心响App产品经理黎宇昕进行了交流,他们结合心响App的研发,分享了当下AI 智能体行业发展的新思考。以下为交流实录,部分内容略有删减:


提问:短期组建的团队要在一个月内做出这一产品,为什么这么着急?是老板给定的deadline,为的是抢占行业时机节点?


黄际洲: 我们没有非要赶某个时间节点,老板也没有给我们下目标(笑),我们就是想发一个现货。


AI智能体的摩尔定律是,每隔7个月AI智能体能完成的最长任务时长会翻番,设想一下如果按部研发、迭代,那等到呈现给大家用时,已经过时了。所以每一个节点,我们会逼着自己做一个(产品)发布。


提问:目前心响只有App,将来会出PC端吗?


黄际洲: 会的。PC端在计划中,包括大家可能想要的上传文件、输入Excel表格输出图表、做分析、与Word联动等功能,都会有的。


提问:据了解,Manus这一智能体产品也在海外上线了App端,你认为PC端与App端智能体的不同点在哪?


黄际洲: 首先,第一个不同也是最大的难点是,不是技术上实现不了,而是手机屏幕实在太小了,如果想让用户看清楚某个东西,或者进行快速交互时,不是件容易的事情。反之,PC端的屏幕大,但大也会带来问题,就是如何高效利用起来,高效交互。


第二是,在PC端可以非常方便地去打开各种生产力工具,比如Excel和Word,但在移动端想传一个文件难度很大,快速填表、填数据等在PC端很容易实现的事情,在移动端不容易实现。


黎宇昕: 当然,两者技术上有更多的相通性,我们可以用多智能体协同的Pipeline去实现这个功能。PC端更多倾向于办公场景,比如PPT,我们确实有生成PPT的功能,但是在手机播放PPT也太鸡肋了,但在PC端就会相对轻松,文案一键编辑、自动改编、填表、写文档等都可以。


提问:当前的通用智能体或者超级应用,都是多智能体协同操作,过程中的技术难点在哪?


黄际洲: 首先,最大的问题在于很多时候想去接入很多东西,而MCP协议的出现解决了这一问题,让大家能更快地接入。但到目前为止业界比较大的问题在于,大家都想获得但很少去做贡献,免费好用的工具实在太少了。可以算一个数字,把Tool Use做成MCP给到别人,乘以1000是很小的成本,但如果乘以10万、100万、1000万、1亿,那很难扛得住这个成本,所以我们想要构建广泛的生态,呼吁更多的开发者一同来做,这是一个所有人都受益的事情。


第二个问题是,要实现多模态工具间的使用,比如Agent Use,必须要有很强的协议。举个例子,平时工作中做(产品)开发会有PM、PE、FE各种各样的研发,承担不同的角色,彼此知识背景、专业术语不一样,说的话很难互相理解,频率不同接收的信息就有折损。智能体也一样,各个子智能体之间的互动和信息传递要尽可能做到无损,所以需要设计很好的协议和交互方式,能够把它协同起来。


第三个问题是大模型产品的“不可能三角”(虎嗅注:“不可能三角”国际经济学的一个著名理论,简单来说是指如果一件事情同时存在三个要素,三者不可都得),以搜索为例,大家已经养成的搜索习惯是输入一个词很快就返回答案,这是我们对搜索的心智。而对任务心智来讲,你要的是一个精准替你完成任务的管家,智能体产品能帮你完成任务、交付很好的结果。但在当下的技术发展趋势下,很难让它短时间内给到你最终任务结果,所以要做出(时间)牺牲。

 

提问:目前心响上各个场景中的智能体,都是百度自己开发的,还是外部接入?


黄际洲: 我们很难把智能体开发得超过很多专业玩家。比如AI绘本,是接的百度文库的AI绘本功能,为了做到免费,我们向百度文库争取到了最大权益。健康也是如此,引入的是第三方。未来,我们想要构建开放生态,只要是市面上好的体验、做得比我们好、愿意被我们接入或者愿意接入我们,都可以接进来。


提问:当前越来越多的大厂开始接受MCP,未来智能体可能会变成红海赛道,竞争激烈。像是前段时间支付宝的百宝箱开了支付MCP Server协议。那百度在智能体竞争中,想怎么做?


黄际洲: MCP是个通用协议,只要大家遵循这个协议,开发者就不需要为A、B、C、D各开发一份,省时省力。而对于接入方来讲,遵循这一协议以后,可以很方便地接入,不需要再充分对接。


对我们来讲,现在是这样,如果某一东西(功能)是我们内部开发的,那有比MCP更高效的协议,从而保证更快接入(心响)。我们既支持自己独有的协议,也会把MCP接进来,这是一个原则。


当前实践告诉我们,优质的MCP是稀缺的,因为算力很贵。我做这么好的服务,不可能免费接入,我要构建起商业模式。但用户想白嫖,我们也想白嫖,开发者就被白嫖死了,无法养家糊口。所以未来是有一个供需之间的GAP存在,而最终生态的繁荣一定是能把商业模式跑通的繁荣。开发者能挣到钱,我们能挣到钱,需求越做越大,给大家提供越来越好的体验。当前,我们只专注于给用户提供极致的通用超级智能体产品体验。


提问:现在大家都在说超级智能体或超级应用,你认为最终的交互方式该是怎样的?


黄际洲: 对于这一问题,我们也一直在思考。


关于交互方式,如果把用户千奇百怪的输入和不同的交互方式(语音、文字等)整合在一个产品里,这对于交互的要求超高,在完成不同任务时,也很难。所以我们一直强调一个很简单的输入,目标就是消灭复杂的prompt,但这很难一下子做到,所以我们尝试从极简化用户需要输入的东西开始,比如做城市攻略,用户输入“哈尔滨旅游攻略”就足够了,剩下的事情智能体会一步步帮你细化和完善,最后给出一个成品。

 



文章标题:百度,来势汹汹

文章链接:https://www.huxiu.com/article/4282325.html

阅读原文:百度,来势汹汹_虎嗅网

本文被转载1次

首发媒体 虎嗅网 | 转发媒体

随意打赏

提交建议
微信扫一扫,分享给好友吧。