实测文小言升级:开始「卷体验」的百度都眉清目秀了
刚刚无缝接入文心 4.5、文心 X1 和 满血版 DeepSeek-R1 的文小言,转身又整出了新动作。
3 月 31 日,文小言迎来了一次全面升级,上新了多模型融合调度、全新语音大模型、图片问答、拍题讲解等多种新功能。
新功能听起来很厉害,但实际使用效果又如何?不多赘述,AI 科技评论先替大家实测一波。
更强大的“大脑”
据透露,文小言目前已经集齐了市场上的最强模型,拥有了更强大的“大脑”。
这一点体现在了这次升级中的多模型融合调度功能上,而所谓的融合调用,其实就是在面对不同类型的问题时,文小言可以自己选择能够提供最优解的模型,从而保证用户的使用体验。
实测阶段,我先是丢给了它几张鹦鹉的图片,并问它图中鹦鹉的性别,这个问题对于我来说,难度不亚于“凭鸟腿断品种”的难度,而文小言却轻松回答,并且给出了判断依据。之后我又让资深养鸟发烧友也看了一遍,最终的答案和文小言给出的答案完全一致。
后续我又翻出来了两张衣服吊牌的图片给它,并让它帮我分析一下图中的衣服哪件的面料更适合徒步。紧接着的一连串的推理分析中,它不仅分析了面料的透气性和耐磨性,甚至连吸水性都考虑了进去,有些暖心了。
除了分析衣服面料,我还把几张护肤品的成分表扔给了文小言,让它帮我挑一个适合敏感肌在春天使用的款式。我本以为它会把所有拗口的成分全都罗列出来分析一遍,没想到它只是对每个产品的优缺点进行了展示分析,直接明了的对比了不同产品可能带来的使用效果,最后给出了明确的对比结果。简单直接又通俗易懂。
同理,我还用它测试了一下酱油的配料表,让它帮我挑一个健康的酱油。不出所料,分析过程十分详细,还把每种元素的多少所对应的适应人群给分析出来了,细节拿捏的很好。
测试到这,其实我就已经对文小言的“更强大脑”有了一些认同感,但又觉得这可能并不是极限,于是翻出了一张之前的验血报告甩给它,让它用大白话帮我分析一下报告中显示的身体状况,并给出一些后续的保养意见。不得不说,它最终给出的答案,确实是大白话,也确实挺准确。
除了擅长推理分析,文小言还能看图识景,只需给它一张图片,就能精准识别图片中的景点,哪怕是只有一条河亦或是一座山,都能被它“一眼看穿”
更为复杂的人文风光也同样不在话下,根据建筑风格和自然景观轻松识别出正确答案。
除此之外,我还上传了一张英文菜单,并命令文小言在有限的预算内,结合我的饮食习惯,帮我翻译并规划如何点菜。虽然最终的结果并没有将中英文菜名一一对应展示,但给出的结果还是比较符合常理,如果真的在日常生活中使用到的话,属于是比较好用的一个功能了。
文小言除了能化身集翻译、预算控制为一体的点单神器外,在拍照解题方面也是一把好手,例如在解决一些简单的数学问题上,也不再是列出冗长且较为晦涩的解题过程,而是直接亮出真人解题视频,简单又直接。
更会说的“嘴巴”
当然,文小言这波升级,不仅有了更强大的“大脑”,还有了更会说的“嘴巴”,即更强大的语音大模型功能。实测下来,感觉文小言的语音功能反应速度很快,而且还是个“捧哏”选手,永远不会让话落在地上,感觉可以和豆包有一拼了。
测语音功能时,我用的还是第一个鹦鹉分公母的问题,这次我直接用语音问它,问题前脚刚问完,仅仅过了两秒钟,文小言就开始侃侃而谈,而且还有很多语气助词,很贴合日常生活中人与人之间那种对话的感觉,而且问题解答得也很透彻,还支持互动交流,体感拉满了属于是。
除了答得快、答得好,文小言的语音互动甚至还支持用方言回答,虽然有些语调还稍微欠缺点“人味”,但整体听起来并没有那么违和,方言这块虽然让我很惊喜,但是觉得还是有可以提升的空间。
语音这块,还有一点让我觉得很有意思的是,文小言竟然还是个“带娃高手”,可以快速接收小用户的需求并且迅速反应调整输出的内容。例如,当小朋友文小言讲故事,但它讲的故事小朋友都表示听过的时候,文小言还能快速反应,找到更多的故事讲给小朋友听,不给他留下一点哭闹的机会,“带娃高手”实锤。
整体来看,文小言的语音大模型还是非常亮眼的,这一切都要归功于百度发布的业界首个基于全新互相关注意力( Cross-Attention )端到端语音语言大模型,它在实现了超低时延的情况下也实现了超低的成本,在相关问答场景中,调用的成本比行业均值下降了50%-90%。
从目前的表现来看,百度在语言模型技术上已经取得了显著的领先优势,但更值得关注的是,百度的领先并不仅限于技术层面。事实上,它在应用生态和产业布局上也展现出全面的优势,这种多维度的突破正在重新定义行业竞争的格局。
更开放的精神
纵观百度近期这一系列密集的动作,不难发现文小言只是其中的关键一环,而百度此番操作的内核,实则是围绕用户价值精心打造并全力挥出的一套组合拳。
3 月 16 日,百度正式发布了文心大模型 4.5 及文心大模型 X1,并提供免费使用服务。在此之前,百度宣布推出文心大模型 4.5,还计划在未来几个月内迅速推出文心大模型 5.0,并于 6 月 30 日起正式开源。
时间再往前倒一个月,2 月 16 日晚,百度搜索和文心智能体平台宣布全面接入 DeepSeek 和文心大模型最新的深度搜索功能。
2 月 13 日,文小言宣布自 4 月 1 日 0 时起全面免费,使所有 PC 端和 APP 端用户都能体验到文心系列最新模型及其功能,如超长文档处理、专业检索增强、高级AI绘画、多语种对话等。
然而,并非所有大厂都愿意接入 DeepSeek,一些大厂可能出于多方面的考虑,对是否接入DeepSeek持谨慎态度。
例如从技术竞争角度来看,部分公司可能担心接入 DeepSeek 后,会在一定程度上削弱自身在技术方面的独特优势,从而影响其在市场中的竞争力。在商业利益方面,他们也需要评估接入 DeepSeek 对其自身商业利益的影响。例如,接入 DeepSeek 后可能会改变现有的市场格局和竞争态势,对公司原有的市场份额和盈利模式产生冲击等。
但百度在这一战略抉择中展现出差异化的格局 —— 作为中文互联网领域少有的具备全栈 AI 能力的企业,这种底气不仅体现在日均千亿级真实需求的算法锤炼,更植根于二十多年中文语义理解的场景沉淀。
整体来看,在大模型的开放浪潮中,百度一直紧跟行业风向标,以自身的实际行动,不断的推动着行业的发展和变革。它通过这一系列紧密相连的举措,不仅在技术上与国内外领先水平保持同步,更在用户服务和市场布局上展现出了独有的竞争力。
这种以用户价值为核心,以开放创新为驱动的发展模式,不仅为它在 AI 领域的未来发展奠定了基础,也为 AI 技术向着更加开放,更加惠普、更加智能化的方向发展,为用户创造更多价值。
雷峰网 (公众号:雷峰网) 认为大模型开放是大势所趋,行业领军者都在主动开放,而百度早已身在其中。
雷峰网原创文章,未经授权禁止转载。详情见 转载须知 。