不要小看「实而不华」的腾讯 AI
上周AI领域最热闹的莫过于大洋彼岸OpenAI与谷歌的「掐架」,前者前脚刚发新一代旗舰模型 GPT-4o,把语音助手带到了新高度,后者就也在提到 121 次AI的发布会里推出了超级智能助手Project Astra等产品,两家一起将下一阶段AI公司竞赛的关键点落在了「智能助手」上。
众人视线不自觉聚焦在海外巨头,这一边,国内AI领域的动静似乎被忽视了。 但其实国内最重要的两家大厂,也都在上周交出了各自一年来的答卷。
字节跳动一次性发布9个豆包大模型,把大模型的价格打了下来——豆包主力模型在企业市场的定价是 0.0008 元/千 tokens,比行业便宜 99.3%。
另一家巨头腾讯也交出了大模型阶段性的答卷。上周,腾讯一连开了两场发布会,第一场宣布混元文生图升级采用DiT架构并开源,第二场,腾讯重申了以“产业实用”作为发展大模型的核心战略,并从模型侧、工具侧、应用侧三大核心层公布了一系列 AI 战略的最新进展。
作为国内最大的互联网公司,腾讯是中国拥有最丰富的社交和文娱场景数据的科技公司之一。在去年发布混元大模型之后,过去一年里并没有像其他大厂一样高调大刷存在感, 而是低调默默地建设 AI 基础设施、产业生态,以及探索应用到腾讯原有业务和产品,持续推动 AI 业务发展,并在广告等业务上率先找到突破点,给其带来了数亿乃至数十亿元的收入增长。
腾讯依然是国内 AI 领域不可忽视的力量。现在是一个很好的时间节点,结合上周的发布会,我们梳理了目前腾讯 AI 战略在模型层、工具层和应用层的具体动作和接下来的具体规划,希望能帮你看清其在 AI 领域当下的动作以及未来的战略思路。
模型侧: 基础模型能力升级,构建多模态能力
首先是基础模型方面 ,5月17日的峰会上,腾讯混元介绍了其多尺寸的LLM模型矩阵。其中,最大模型已拓展至万亿级参数规模,并在1B、3B、7B、13B等不同参数量下,均有布局。
在腾讯云上,混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务,目前已面向企业及个人开发者全量开放。
腾讯混元模型服务通过腾讯云对外开放|图片来源:腾讯
其中,hunyuan-standard最新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力。
升级后的腾讯混元,采用混合专家模型 (MoE) 结构,模型总体性能相比上一代提升了50%,部分中文能力已追平GPT-4,在处理“时新”问题的表现上,包括数学、推理等方面的能力也有显著提升。
多种尺寸的腾讯混元MoE模型也即将对外开源,可适用于手机端、PC端、云/数据中心等不同的部署场景。
在多模态方面,腾讯也有了较多进展,尽管目前展示的主要是生成方面的多模态能力,并未展示类似GPT-4o的多模态输入能力。
生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,并对外开源;
在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持 16s 视频生成,预计在第三季度可以实现30s视频生成,同时,腾讯副总裁、腾讯混元大模型负责人蒋杰称,混元生成视频的分辨率和运动幅度都优于Pika和Runway,不过目前,混元还未向C端用户开放视频生成能力;
在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型,在动漫、汽车、建筑等产业已有不少应用。
工具侧:构建离产业最近的AI
基于产业对模型的多模态能力需求以及性价比与效率要求,腾讯云在这次峰会上推出三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业更高效、简单地用大模型开发AI原生应用,快速接入生产场景。
大模型知识引擎: 企业用自然语言,5分钟就可以开发出一款知识服务应用,腾讯内部已有多款SaaS应用依托知识引擎进行升级,包括客服场景、数字人服务场景以及企业知识服务场景等。
图像创作引擎: 基于腾讯混元的自研图像创作底层模型,输出高质量的AI图像生成和编辑能力,为企业客户提供AI写真、线稿生图、图像风格化等能力。
视频创作引擎 :基于多模态算法技术,输出高质量的视频生成与处理能力,提供视频转译、视频风格化、画布拓展等多种功能。
应用侧:对内落地600余业务与场景,对外开启智能体生态
对内,目前混元大模型已经在600多个腾讯内部业务和场景中落地测试:
微信读书基于混元大模型推出了AI问书、AI大纲等新功能,大大提升用户的阅读效率和体验。
腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了38%,其人工客服助手在多个游戏客服场景应用,日均用户请求量达到150万次。
腾讯会议基于混元推出的AI小助手,可即时回答会议内外问题,大幅提升开会效率。过去四个月,腾讯会议AI小助手的每日调用量增长了20倍。
企业微信、腾讯文档等协作SaaS产品也全面接入腾讯混元。
腾讯广告基于腾讯混元推出了一站式AI广告创意平台——腾讯广告妙思,助力提升广告生产及投放效率。
对外,腾讯混元也将开启智能体生态:
上线一站式AI智能体创作与分发平台「腾讯元器」 ,未来,用户不仅可以通过提示词、插件、工作流、AI辅助创建等能力在平台上创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云等渠道上。
「腾讯元器」页面|图片来源:腾讯
此外,基于混元大模型打造的C端助手App腾讯元宝也将于5月30号发布。 腾讯元宝是一个基于混元大模型及搜索引擎驱动的高效信息整合工具,界面设计简洁,可以搜索实时信息,可以对上传的多格式文档进行总结、翻译,也可以语音对话练习口语。
核心战略:「产业实用」
腾讯发展大模型的核心战略是“产业实用”,去年发布大模型时,腾讯就强调“大模型的打造只是起点,把技术落地到产业场景、创造价值才是目标”,在交出当下这份答卷时,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生重申了这一点,“大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标”。
早在2022年6月,腾讯广告业务就已经在借助大模型来降本增效:混元AI大模型助力系统深刻理解广告内容,精排大模型提升广告和用户的匹配准确率。
更直接地,去年年底,人工智能技术驱动带来的业务增长在腾讯财报中开始有了更加明显的体现。
在2023年第四季度及全年业绩发布后,腾讯董事会主席兼首席执行官马化腾表示,「2023 年,我们在多个产品和服务上取得了突破,视频号的总用户使用时长翻番,广告 AI 模型的改进显著提升了精准投放的效果…… 这些发展带动了高质量的收入来源,推动毛利增长 23%。」
在5月公布的一季度财报中,AI对业绩的带动作用再次被点明。一季度,腾讯的收入和利润超过了分析师的预期——毛利润同比增长66%,达到145亿元。而这主要归功于其广告和商业服务部门的盈利能力有所改善。
腾讯利用生成式AI来提高用户在微信平台上的参与度,并增强了广告主定位能力。微信搜索引擎展示的广告被特别提到,这类基于搜索的广告可能正是腾讯未来的潜在增长点所在。在视频号、小程序、公众号和微信内搜索的推动下,一季度,广告销售额同比增长26%至265亿元。
鉴于微信用户的高度参与度,以及微信搜索本身在搜索量上的增长,以及微信内部不断扩展的内容生态系统(包括公众号、小程序以及视频号),腾讯总裁刘炽平认为,微信搜索大有增长空间。
尽管广告属于传统业务,但其结合 AI 的经济效益已经开始显现,腾讯首席战略官詹姆斯·米歇尔更是提到,腾讯将成为部署人工智能的「最大受益者」,预计AI将简化和自动化广告和目标定位过程,使得社交媒体公司能够为广告商提供更具竞争力的体验,这些体验与搜索引擎和电子商务平台已经提供的广告体验相媲美,但社交媒体平台的优势在于用户投入的时间和参与度远超过搜索引擎或电子商务平台。
拥有微信、QQ以及诸多王牌游戏在手的腾讯,在社交和游戏领域有着「护城河」般的原生优势,为其与这波生成式AI的结合提供了更多的可能性。但生成式AI变革迅速,这意味着潜在的风险不小。若腾讯未能及时适应技术范式的转变,可能会面临来自新兴竞争对手的挑战,或错失利用AI技术进一步巩固其市场地位的机会。
不过,通过持续的技术创新和产品迭代,腾讯不仅在内部业务中实现了AI技术的深度融合,而且通过开放平台和生态建设,积极推动AI技术的产业化应用。腾讯的AI战略,特别是其“产业实用”的核心理念,有望在未来几年内为其带来更加显著的商业价值和市场竞争力。
头图来源:视觉中国