腾讯钟学丹:人工智能成为汽车行业新质生产力 推动数智化升级
近日,在中国电动 汽车 百人会论坛(2024)新质生产力分论坛上,腾讯智慧出行副总裁钟学丹发表了题为《AI驱动汽车“新智能”》的主题演讲,分享了腾讯AI大模型等新技术在汽车产业的创新应用成果。
腾讯智慧出行副总裁钟学丹
钟学丹表示:“人工智能将作为新质生产力,推动汽车产业从数字化向数智化升级。”
随着大模型技术的不断迭代,AI大模型在汽车行业的应用场景也在不断丰富,在汽车的研发、生产、销售、服务、协同管理等各环节中,叠加AI的生产力,实现提质、降本与增效。大模型在带来产业革命的同时,挑战也随之而来,钟学丹指出:“大模型距离大面积的落地应用,还面临着几大核心挑战,主要是模型、数据、算力这几个方面。”对此,腾讯面向汽车行业整合了完整的能力架构,从AI基座、AI平台再到业务场景应用全面助力汽车行业新智能发展,并和十多家车企探索大模型应用。
以下是演讲全文:
各位领导,各位行业同仁、 媒体 朋友们:
大家上午好!很荣幸借今天的场合,和大家一起交流AI大模型等新技术在汽车产业的创新应用。
近期大模型又取得了一系列突破进展:视频生成大模型Sora,已经具备对世界的感知、观察和交互能力,距离真正的“世界模型”更进了一步。Claude 3发布的官方测试成绩,全方位超越 GPT-4水准。可以说,大模型的演进速度已经超出想象,进入百花齐放、全面应用的阶段。腾讯去年推出全链路自研的通用大语言模型——混元大模型,达到千亿级参数规模,超2万Tokens预训练语料,是目前国内最大的中文大语言模型之一。前两天,混元团队也带来了最新的图片生成视频模型。基于混元,我们推出了汽车行业大模型,并与十多家车企展开了应用实践。
在大模型的驱动下,汽车产业已经站在了“新智能”发展的开端。可以预见,大模型的应用不仅将改写智能汽车的算法和逻辑,也将大大促进生产力的革新,与汽车各业务场景相结合。人工智能将作为新质生产力,推动汽车产业从数字化向数智化升级。
目前,各大汽车企业已纷纷将大模型纳入重点投入规划,在汽车的研发、生产、销售、服务、协同管理等各环节中,叠加AI的生产力,来提质、降本与增效。对于企业员工而言,人人都能借助AI来实现创新。
然而现实情况是,大模型距离大面积的落地应用,还面临着几大核心挑战,主要是模型、数据、算力这几个方面。
首先是模型方面的挑战。行业已经共识,相比于通用大语言模型,汽车垂域大模型才是更优解。通用大模型主要在AI交互层面应用,但是在一些业务场景下,专业知识与行业数据积累不足。所以,选择汽车行业大模型,加上企业自己的数据做训练或精调,才能打造出实用性高的智能服务。如何在合理的成本下,选择合适的模型,是企业所需要思考与决策的。
其次,是数据方面的挑战。数据是大模型的原料,而高质量的数据目前非常稀缺,目前我国的自动驾驶和汽车行业数据体量是远远不足的。同时,还要考虑数据分类、标注、训练各环节的投入产出比,更要时刻关注敏感数据的保护与合规。
第三,是算力方面的挑战。要想从根本上突破单车算力的物理上限,就需要云端、车端一体化的算力协同,实现充足的算力供给和弹性拓展。同时,大模型的训练对网络速度与稳定性要求也很高。
面对大模型带来的机遇和挑战,腾讯面向汽车行业整合了完整的能力架构,从AI基座、AI平台再到业务场景应用,全面助力汽车“新智能”发展。
在基底模型方面,我们开放全链路自研的混元大模型,并推出汽车行业大模型,同时也开放接入20多个主流开源模型,以更开放、灵活的方式帮助客户根据实际需求,选择合适的模型,打造自己的专属模型。
在AI基座层,腾讯云提供全球领先的算力、网络等基础资源,通过软硬件协同创新,为大模型训练和研发提供大规模高性能计算。在AI工程中台层,我们提供覆盖大模型全生命周期的工具链,通过智能研发平台、数据平台、AI 开发平台、AI Agent平台等能力,有效降低大模型训练难度,提升研发效率。
更上层的应用方面,其实技术和实际的应用还是有很大gap要去弥补,我们如何把这些具体的应用知识和这个行业的know how更好的结合在一起,真正的去应用起来,这是我们在致力于做的地方。
我们还为汽车行业提供全栈安全防护方案,帮助车企打造面向AI大模型时代的安全度量和防护体系,为大模型开发提供更加安全的环境保障。
算力是模型持续运转的基础,在基座层,我们为大模型进化提供高性能、高带宽、低延迟的算力支持。
腾讯分布式云原生调度总规模超过1.5亿核,并提供16 EFLOPS的智算算力,不仅能服务于大模型训练,还将在自动驾驶等场景中充分应用。新一代HCC高性能计算集群,搭载最新次代GPU,支持10万卡GPU超大计算规模,是国内性能最强的大模型计算集群之一,最快四天就可以训练万亿参数的大模型。腾讯自研的星脉网络,则为新一代集群带来了业界最高的3.2T通信带宽,使得超大算力集群仍然能保持优秀的通信开销比和吞吐性能,GPU利用率提升到60%以上。
在算力基座之上,腾讯提供一套完善、开放的AI工程平台,集成了业界领先的各类工具。比如,腾讯推出的首个AI原生的向量数据库,可以高效处理车端回传的海量视频、点云等非结构化数据,最高支持10亿级向量检索规模,百万级查询(QPS),延迟控制在毫秒级。
基于腾讯云TI平台的行业大模型精调解决方案,可以帮助模型开发者与算法工程师,一站式解决数据处理问题,保障数据高质高效、安全合规地处理。前不久,我们对TI平台的工具链进行了全新升级,全新升级的太极Angel框架,通过异步调度优化、显存优化、计算优化等方式,让大模型的训练效率提升至主流开源框架的2.6倍,推理加速比达到了2倍。
在大模型应用方面,腾讯已经和十多家车企围绕研、产、销、服、管理等多场景展开合作。比如,在汽车软件研发环节,大语言模型不仅懂人类语言,还掌握多种程序语言,可以帮助程序员写代码。腾讯云新一代AI代码助手,实现了AI对代码的理解,可以辅助程序员编写、排错与测试,提高汽车软件的开发效率与代码质量。
在生产环节,我们和多家企业在AI工业质检领域展开合作,让AI进行瑕疵汽车零部件筛查、违规操作告警等,将工作人员从重复查看视频的工作中释放出来。基于腾讯数字孪生技术助力车企数据中心、工厂车间的“透明化管理”,实现降本增效和低碳节能。
在 营销 场景,新一代的腾讯企点智能客服,基于行业大模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,复杂问题的解决率比之前提升了85%。同时,通过AI智能销售助手,销售人员用自然语言进行提问,就可以获得准确的 商业 分析,几秒钟可以获取一份PPT,不再需要花费大量的时间学习复杂的软件、制作看板。 除此之外,我们也把线上和线下结合,比如像数字人直播带货的一些能力,帮助大家可以更好的在线上拓宽触达用户的流量和空间。
我们在去年推出了座舱大模型。大模型上车具体可以做什么?一方面大家比较多提到的智能语音交互以及多模态交互以外,我觉得其实更多的要去增强在效率提升以及娱乐提升方面,如何让服务更好的去触达,而不只是说帮用户去聊天。我们更多的是去做操作、去做服务的触达,可以让用户在驾车的过程中,通过简单的语音和上下文的一些辅助,帮助他更好的完成交互。
在一些智能的操控领域以外,我们也希望更多的结合传感器和座舱能力,更主动的帮助用户去完成一些面对环境变化时的操作。比如说当车辆知道这个地方需要提升空气悬挂的时候,不再需要用户再去发起这样的指令,而是由车辆主动去完成,再通过这种语音提示,让用户感知到。更多的是去帮用户想到,而不是等着用户去发起操作指令。
大模型的应用,也是一个新的开始,大家都面临着很多挑战,特别是大模型训练,其实并不是每一次都会成功,这里的成本和代价都非常高,腾讯很希望跟行业合作伙伴一起在这里去共建和帮大家构建自身的迭代能力。第一阶段,大家首一要考虑的是如何在一些非常明确和具体的领域快速实施,看到效果。有了效果之后,第二个阶段是去构建平台,所以有了这样的一些平台的,才有可能帮我们在未来发展做加速。第三阶段我们会和车企一起,基于这样平台以及跟场景更好的结合过程中间,去创造新的这些应用场景和服务,帮助车企自研自建AI平台。
最后,我想说,汽车行业还处在大模型应用的开端时期,需要产业链上下游开放共创,广泛探索。腾讯愿意将能力和资源开放出来,做好助手和生态共建者,全面助力汽车新智能发展。
谢谢大家!