循环智能荣获2022中国AI金雁奖“技术创新大奖”,千循零样本AI平台首次亮相

砍柴网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

近日,由中国电子商会人工智能委员会主办的2023北京人工智能峰会暨第三届AI金雁奖颁奖典礼在北京盛大举行。循环智能(Recurrent AI)凭借在AI大模型技术上的创新、积累和应用,经过专家评审团的层层评比和筛选后获得了“2022人工智能技术创新大奖”,循环智能联合创始人杨植麟博士也被评选为“2022 AI领军人物”。

循环智能荣获2022中国AI金雁奖“技术创新大奖”,千循零样本AI平台首次亮相

中国AI金雁奖是由来自人工智能领域从技术研发到市场 营销 和创投基金、从国家院士到企业高管和知名 投资 人等不同背景的专家和机构组成的评审团,从多维度的观察与剖析,多面向的评估与考核,经过初审、复审到终审,层层评比、层层筛选出在AI技术和 商业 领域有着突破性重要贡献的单位和个人,致力于不断为中国人工智能 科技 领域发掘出优秀的“头雁”。

循环智能自主研发千亿参数预训练NLP大模型“盘古”,是业内首个千亿参数的中文大模型,拥有1100亿密集参数,经过40TB的海量数据训练而成。同时也通过多任务prompt等技术延伸出10亿参数、性能更好的落地版本,极大地加速了AI的商业应用效率和泛化能力,提升NLP模型生产效率10-1000倍。“盘古”大模型刷新了世界中文CLUE榜单三项记录,并获得了2021世界人工智能大会“SAIL之星”荣誉。应用层面,循环智能提供基于“AI+销售科技”的解决方案,目前已赋能超100万一线人员,日均处理上亿次对话,在各行各业积累了丰富的销售增长实践、销售分析模型和最佳沟通素材,累计生产了10000+面向各行业业务流程的AI数据模型。本次评选,循环智能凭借AI大模型技术创新、大量业务实践赢得了评审团的认可,获得“2022人工智能技术创新大奖”和“2022 AI领军人物”两项大奖。

循环智能荣获2022中国AI金雁奖“技术创新大奖”,千循零样本AI平台首次亮相

颁奖典礼上,循环智能联合创始人兼CTO张宇韬博士作为获奖企业的代表,受邀发表了《AI大模型在企业服务场景下的实践与探索》的主题演讲,与现场领导、评审团、行业专家、 媒体 和100多位企业代表分享了AI大模型在企业落地的主要挑战、循环智能“千循零样本平台”多模型策略和应用场景,以及在大模型在企业应用场景的最新探索与实践。

以下是演讲内容的回顾:

以ChatGPT为代表的大模型应用开启了通用人工智能的新范式,其中最关键的技术创新是基于人类反馈数据的系统进行模型训练,从而提升了理解人类想法的准确性。

但企业在使用AI大模型时也面临着三大挑战,这些挑战也体现了GPT模型的局限性。

挑战一:事实性错误 。事实性错误(即看似正确,但与事实不符),是GPT模型的原理带来的。GPT的模型优化目标是在有限的训练数据上泛化出无限的能力,当问题超过模型知识范围时,会开始自我创造。事实性错误的挑战,虽然在现有的技术路线下无法百分之百解决,但可以通过两种路径来“减弱”其影响。第一种是提升模型的知识范围,当模型的知识范围越大时,事实性错误也就会越少。第二种是通过更好地让模型对齐人类的需求和价值观,尽可能以合适的方式拒绝回答超出范围的问题,从而减少事实性错误造成的影响。

挑战二: 难融入企业私域数据 像ChatGPT这样的通用AI系统,其能力上限是公域存量数据的范围,因为企业内部大量的信息、知识、数据均无法被公域模型覆盖。因此,企业内的垂直业务需求是无法被公域模型准确理解的。而企业内的垂直业务需求是与业务流程强相关的,往往需要结合内部数据作为上下文,才能准确理解。例如,客户质量分析场景,企业客户如果直接使用类似 ChatGPT 的通用AI系统,输入客户信息和对话内容,来判定客户是否属于优质客户,那么得到的结果往往不理想。主要原因是,通用AI系统并不清楚企业内部对于优质客户的定义,而且不同企业对于优质客户的定义很大程度上是不同的。

挑战三: 规模化应用成本高 。当前,百亿参数的模型输出(推理)速度大概可以做到每个GPU每秒生成 20 个字左右(30token)。在实时文本交互(在线客服、问答)场景,一个GPU支持3-5个并发客户,那么100万“日活跃用户”,对应的峰值并发约10000,需要 2000-3000个GPU,成本过于高昂。在实时语音交互场景(电话沟通、语音通话、视频通话)场景,在单个GPU单并发情况下,文本生成的句末延迟约1到3秒,叠加TTS(文本转语音)的延迟,基本无法支撑需求。

过去几年,循环智能在大模型训练和应用实践中有非常多的技术积累,为解决这些难题打下了良好的基础:首先,积累了大量行业文本和语音数据,中文文本数据超过40TB,真实语音对话数据超过 400 万小时;其次,具备超大规模预训练模型的工程化经验,主导开发和落地了首个千亿参数的中文语言大模型“盘古”,具备丰富的数据采集、清洗和标注经验。主导开发了面向认知的“悟道·文汇”超大规模预训练模型;第三,精通场景化的多任务指令微调,在银行、保险、证券、地产、 汽车 、零售等行业有丰富的业务实践。

循环智能荣获2022中国AI金雁奖“技术创新大奖”,千循零样本AI平台首次亮相

今年,循环智能也将推出自研的“千循零样本AI平台”。“千循零样本AI平台”采用了多模型组合的策略,包括10亿参数的盘古NLU(自然语言理解)模型,主要服务语义理解的场景,和面向更复杂的文本生成类任务、参数规模更大的“千循-M”和“千循-XL”模型等。同时,为了使模型更好地适配企业需求,“千循零样本平台”提供多种“微调”方案,包括 P-tuning、Instruction tuning、LoRA等,可以更好地融入企业的专有知识库数据。

“千循零样本AI平台”在底层提供AI大模型的高质量文本理解能力、逻辑推理能力和文本生成能力。基于这些能力,在企业需要对外交互的营销场景、服务场景,以及内部的知识培训和内容运营场景,提供多种创新应用,帮助不同场景的不同角色员工提升产能和工作效率。

在智能化内容运营与生产场景,“千循零样本AI平台”提供“话术质量的分析&挖掘与优化建议、文案自动化生成与撰写、以及基于知识库的智能问答能力。

在客户画像与需求的智能分析场景,“千循零样本AI平台”提供基于对话内容自动识别客户画像与需求、基于对话内容总结客户所有兴趣点&评价和提问以及自然语言输入信息,快速进行客户描摹能力。

在智能化业务分析与决策推荐场景,“千循零样本AI平台”提供“基于对话全文生成业务策略的能力”,在房产和汽车销售场景,可以给出靠谱的商机跟进建议。还提供“基于对话内容评判服务效果”的能力,可以帮助企业了解客户对售后服务是否满意,以及满意的地方和不满意的地方分别是什么。之前企业主要是通过问卷来收集客户满意度,填写问卷的人数占比很少,现在可以做全量的满意度分析。

随意打赏

提交建议
微信扫一扫,分享给好友吧。