腾讯汤道生:打破AI“落地玻璃”,让可见变为可用
(图:腾讯集团高级执行副总裁、云与智慧产业事业群CEO 汤道生)
5月17日,“腾讯云生成式AI产业应用峰会”在北京举办,大会披露了腾讯混元大模型、行业大模型的最新能力升级,并推出知识引擎等多个智能工具和场景应用。
会上,基于混元大模型的一站式AI智能体创作与分发平台——腾讯元器首次亮相,企业和开发者可以基于腾讯元器直接创建智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、 微信 客服、腾讯云等渠道上。同时,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地最优性价比模型方案。
目前,腾讯混元大模型已经在腾讯内部600多个业务和场景中落地测试。其中腾讯会议就基于混元推出AI小助手,通过简单自然的指令,就可以完成发言提醒、观点总结、会议纪要等能力,大幅度提升会议效率。过去四个月,腾讯会议AI小助手的用户日调用量增长了20倍。
腾讯云也专门推出了三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”,打造大模型原生工具链,助力企业在知识服务、图像和视频创作上提质提效。
以知识引擎为例,它在RAG(检索增强生成)技术架构基础上,整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术,为企业打造使用门槛低的模型应用开发平台,能够快速在客服 营销 、企业知识社区等各种以人为中心的业务场景落地。这种方式相当于带着“课本”去考试,可以大幅度降低幻觉,回答内容更安全可靠。
“大模型的打造只是起点,把技术落地到产业场景,创造价值才是目标”。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,腾讯始终以“产业实用”,作为发展大模型的核心战略,通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI,助力千行百业智能化升级。
以下为汤道生演讲全文:
构建离产业最近的AI
非常高兴和大家一起探讨生成式AI在产业应用中的发展。今天也是一年一度的“世界电信日”,今年的主题是“数字创新,促进可持续发展”,与我们的发布会也非常契合。
作为数字创新最重要的领域之一,生成式AI在过去的一年风起云涌,各种大模型层出不穷。与很多大模型厂商不同,腾讯始终以“产业实用”,作为我们发展大模型的核心战略。去年发布大模型的时候,我们就强调“大模型的打造只是起点,把技术落地到产业场景、创造价值才是目标”。
在过去一年里,我们发布的全链路自研的混元大模型参数规模达到了万亿级别,在国内率先采用混合专家模型 (MoE) 结构。根据沙利文的评测结果,混元的通用基础能力和专业应用能力都处于国内大模型领跑梯队,也高于国际大模型的均线。
目前,混元已经在腾讯内部600多个业务和场景中落地测试。例如,腾讯会议就基于混元推出AI小助手,通过简单自然的指令,就可以完成发言提醒、观点总结、会议纪要等能力,大幅度提升会议效率。过去四个月,用户日调用量增长了20倍。
去年腾讯所倡导的模型应用发展方向——产业实用,获得了业界的高度认同。今天,大家对于大模型的诉求更加务实,不仅关注模型技术的领先性,也要看怎么融合到业务场景,怎么降本增效解决实际问题。
同时,腾讯云智能也推出行业大模型,以高浓度的行业数据,加强模型对行业专业知识的理解;结合搜索增强与实时查询能力,提升模型解决产业问题的实时性、准确度、安全性等能力。目前,也已经在 金融 、医疗、教育、 汽车 、能源等20多个行业落地。
此外,我们也注意到产业对模型的需求也在不断变化。一方面,随着产业信息的载体多元化,模型的需求不仅仅是处理单纯的文字,还需要处理图片、视频等多种信息。大模型的能力竞争,正在从单一的文生文,拓展到文生图、文生视频、图生图、图生视频等多模态能力。
另一方面,大模型在产业场景落地时,所面临的问题还是非常多,比如场景的选择、结果的准确、数据的保密、落地的成本、内容的安全等一系列问题。
如何打破这层玻璃,让可见变为可用?今天我也很高兴能在这里,分享我们全新的探索成果。我们将通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。
首先,混元大模型能力升级,打造智能体开放生态
在基础的大模型能力上,我们的混元也推出灵活的模型规模,基于混合专家模型 (MoE) 结构的pro、standard、lite三个版本,正式通过腾讯云向企业和个人开发者全面开放。我们今天也正式发布基于混元大模型的一站式AI智能体创作与分发平台——腾讯元器,企业和开发者可以基于腾讯元器,直接创建智能体、插件或者是知识库。
同时,行业大模型也在提升专业能力,在安全可控的专属环境下,有更多行业场景的实践落地。
比如,腾讯云医学行业大模型,已经达到大模型 SOTA(最优效果)的水平。6B的小模型就能支持好“问医问药”,也能辅助医生撰写专业文书,比如电子病历、出院小结等。目前,这个模型已经在上海瑞金医院超过10个头部临床科室,为医生和患者提供导辅诊、随访建议、生成电子病历等能力。以体检报告生成为例,平均每5秒即可自动生成一份总结报告,每天自动生成超过500份,报告采纳率达到96%以上。
其次,是工具升级,助力模型应用开发高质高效。
企业非常期待将大模型快速应用于生产、销售和服务多环节,快速创新,以应对行业激烈竞争。
文本、图片、视频是信息的三种基本载体。今天,我们正式推出三款PaaS产品,——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”,打造大模型原生工具链,助力企业在知识服务、图像和视频创作上提质提效。
以RAG(检索增强生成)技术架构为基础,我们推出了“知识引擎”,整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术,为企业打造使用门槛低的模型应用开发平台,能够快速在客服营销、企业知识社区等各种以人为中心的业务场景落地。
企业可以利用自有的知识库与专业文档,结合多模态技术,加载到知识引擎。当用户提问时,系统会先匹配相关文档片段,然后大模型基于提取的内容来生成回答,因此大幅度降低幻觉,回答内容更安全可靠。
例如,在汽车购买中,都会搭载一本厚厚的汽车使用手册,车主使用起来非常不方便。我们与一家汽车厂商合作,将50多款的汽车手册,直接加载进知识引擎。未来,用户只要用自然语言提问,客舱智能助手就能用图文或者语音精准回答,还会搭配上详细的操作示意图,大大提升用户体验。
今天的企业是知识型组织,员工对专业知识的掌握,在产品服务、生产流程、组织管理中的应用,都决定了业务经营与任务执行的效果。每家企业都应该构建起专属的大模型知识引擎,把智能助手融入到不同业务场景,提升员工的专业技能与工作效率。
比如在客服场景,知识引擎可以融入到客服系统,让客服人员更准确、更高效率地解答客户的问题;在产品营销场景,知识引擎可以整合到腾讯企点营销SCRM中,提供更优质的服务,提升客户转化率;在人才培训场景,知识引擎可以结合腾讯乐享知识学习平台,把员工的智慧聚集成企业知识库,促进内部知识分享和传播。
最近我们也和中国大熊猫保护研究中心,联合开展了“AI+大熊猫保护”。广东工业大学的学生们基于我们的人工智能开发服务平台TI-one,打造出第一个“大熊猫智能行为识别模型”。可以连续24小时记录大熊猫进食、喝水等行为,减轻饲养员大量重复的观察工作。他们也在探索结合知识引擎,基于监测行为自动生成分析报表。让饲养员只要问一下,就知道熊猫今天的饮食情况,并且给出健康提示和饲养建议。
在知识引擎之外,我们的第二大引擎是“图像创作引擎”,基于腾讯混元的底层模型,实现业界领先的AI图像生成和编辑能力,支持文生图、图生图等不同需求。调用我们的API接口,可以实现秒级出图,处理时间远低于业内平均水平,可以被广泛应用在营销、设计等领域。
我们的第三大引擎是“视频创作引擎”。它基于多模态算法技术,实现了视频转译、视频风格化、画布拓展等多种功能。我们可以将一部广告片生成不同的风格,比如把真人转为动画人物,也可以一键调整视频广告规格,把竖屏转为横屏,适应不同的投放场景,大大节约了视频二次制作的成本。
最后是模型的安全合规,保护企业的敏感数据。
安全合规是企业人工智能应用的底线。我们针对AIGC场景,推出了系统化的安全解决方案。
在内容安全方面,大模型生成内容经常会遇到虚假信息、内容侵权、诱导风险、个人隐私泄漏等风险。我们发布了腾讯云天御AIGC 内容风控解决方案,结合机器审核、安全专家与版权验证等能力提供一站式服务,机器处理的准确率达到95%以上。
在数据安全方面,我们推出了大模型安全治理解决方案。通过密钥管理、堡垒机、API安全监测等工具,在数据的收集与存储、模型的训练与应用全流程竖起防火墙,保护企业敏感数据,保障数据收集的安全合规。
最后我想说,大模型的发展方兴未艾,我们也将与生态伙伴一起,为产业场景挖掘新需求,创造新价值。许多行业应用厂商在不同行业深耕多年,服务于业务的核心场景;在集成了混元大模型、TI-One与知识引擎等工具后,可以为客户带来产业升级的新动能,并打开新的创收机会。今天,我们也将推出生成式AI生态计划,培育大模型赛道专业伙伴,共同推动AI落地千行百业,助力产业高质量发展。
面向智能未来,我们将坚持用技术去解决一个个实际问题,也将坚持以生态开放与行业、伙伴共建一个美好的智能未来。