科大讯飞刘聪：由ChatGPT浪潮引发的深入思考与落地展望

砍柴网 • 1年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

近期，以“生成式人工智能”（Generative AI）为核心技术的聊天机器人ChatGPT火爆全球。百度、阿里巴巴、科大讯飞、360等国内企业纷纷抛出ChatGPT相关进展，打造中国版的ChatGPT。

科大讯飞此前在投资者互动平台表示，ChatGPT主要涉及到自然语言处理相关技术，属于认知智能领域的应用之一，公司在该方向技术和应用具备长期深厚的积累。并称2022年12月已进一步启动生成式预训练大模型任务攻关，类ChatGPT技术将在今年5月率先落地科大讯飞AI学习机产品。

近日，科大讯飞副总裁、研究院执行院长刘聪围绕什么是ChatGPT，它强在哪里？会对未来世界带来哪些颠覆性影响？进一步阐述ChatGPT来的的模式创新与产业变革。

ChatGPT将会对未来世界带来哪些重大影响？

在刘聪看来，ChatGPT本质上是一个由浮点数参数表示的深度神经网络大模型，属于深度学习的框架。ChatGPT的推出是深度学习提出后又一个里程碑式的技术革命，将为以自然语言处理为核心的认知智能技术发展提供新的“历史机遇期”。

这次ChatGPT引发全球学术界和产业界的热议和关注，关键原因是ChatGPT通过至少以下五个维度能力的显著提升，实现了初步的“智慧涌现”：

1、海量高价值信息的全量在线记忆能力；2、自然语言输入的任意任务和多轮对话理解能力；3、复杂逻辑的思维链推理能力；4、多角色多风格的长文本生成表达能力；5、即时新知识学习应用与进化能力。此外，因为引入了代码作为训练语料，ChatGPT还额外产生了自动写代码和理解代码的能力。

综合来看，ChatGPT的能力之强已不仅是停留在单一场景的人机对话，而是一个同时具备多种能力的通用“对话式AI系统”。与传统认知智能需要针对各领域任务定制对应的系统不同，它不仅能完成多个场景、多轮的相当自然的人机对话，更为重要的是以自然语言交互式学习的“类人”新范式，能在多轮交互中以“类人”的方式交流、学习和进步，并可以自主、快速、不间断地学习各领域专业知识并达到人类专家水平。

他进一步谈到，ChatGPT的初步突破带来的当前影响和未来想象空间是巨大的。在技术演化的基础上，以自然语言处理为代表的人工智能算法有可能重构互联网和移动互联网的产品形态，促进教育业、医疗业、汽车业、金融业、消费业、媒体业、服务业和制造业等众多产业的升级，最终带来对应商业模式的变革。

刘聪认为，类ChatGPT模型的持续发展未来至少会从以下4个方面的能力提升推动产业变革与模式创新：

一是改变现有人机交互模式。 未来人们可能用自然对话的方式与智能产品交互，ChatGPT通过精准理解用户意图，调用系统的各种软件或服务来满足用户需求，提高交互效率与任务成功率。这种人机交互模式的改变将可能改变当前的APP等应用的使用方式，例如多个功能的软件能力被整合，甚至出现“大一统”能力的超级通用APP。

二是改变信息分发获取模式。 基于认知智能技术可实现更高效的信息整合和知识推荐等。以搜索为例，传统搜索引擎根据关键字匹配内容，使用者需要在海量搜索结果中筛选出有用信息，而ChatGPT加持的必应直接给出答案，并提高了问题与答案的匹配精准度，大大提升用户体验。信息分发获取模式的改变将影响流量的分布，并改变流量变现的商业模式。

三是革新内容生产模式，提高生产力。 作为AIGC（人工智能生成内容）技术的典型代表，ChatGPT一经上线便被大量应用于公文写作、邮件编写、代码编写等，ChatGPT的编程能力将极大拓展普通人利用电脑和网络进行创新和创意的能力。未来ChatGPT被集成到word、excel、ppt等工具软件后，将提升内容生产效率与丰富度，变革人们的办公方式，成为新的全行业生产力工具。ChatGPT还将带动图像、音频、视频等形式的AIGC技术与产业发展，使得AIGC的内容既有“好看的外在”，更有“丰富的内涵”。

四是加速“AI for Science”的发展。 对于科研人员，ChatGPT不仅可以辅助生成论文摘要与文献综述，随着其学习的科研数据越来越多，未来有可能提供专业的研究建议甚至主动探索发现新的理论，带来整个科学研究范式的全新变化，把“AI for Science”推上一个全新台阶。

这次ChatGPT所带来的革命将会深刻地改变当今世界的生产和生活方式，重构产业格局，是人工智能领域推动工业乃至社会变革的重大战略机遇，是未来发展兵家必争之地。

科大讯飞在ChatGPT方面有哪些布局？未来研发计划如何？

在ChatGPT引发的AI技术新一轮热潮背景下，科大讯飞基于认知智能全国重点实验室，已在核心算法、行业数据、算力支撑及团队组建等方面建立了优势保障。

核心算法上， 在Transformer深度神经网络算法方面拥有丰富经验，已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务并达到国际领先水平；创新提出了知识与大模型融合统一的理解框架X-Reasoner，有望弥补大模型的模糊记忆技术短板，并在认知智能技术领域，2022年累计获得了常识阅读理解挑战赛OpenBookQA等13项世界冠军；开源了6个大类、超过40个通用领域的系列中文预训练语言模型，相关模型库月均调用量超1000万，在Github平台获得星标数位列同类中文预训练语言模型第一并远超第二名。

数据积累上， 在严格遵守适用法律法规前提下，在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用，为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据，也为基于大模型的创新应用研发和试点推广提供了场景保障。

算力支撑上， 讯飞在总部自建有业界一流的数据中心，为大模型训练平台建设奠定了很好的硬件基石。此外，在工程技术方面实现了百亿参数大模型推理效率的近千倍加速，为未来更大更多认知智能大模型技术经济实惠规模化应用提供了可能。

刘聪表示：“结合我们多年来在深度学习算法、大模型技术、行业大数据、知识图谱、多模态感知、系统工程技术方面优势积累，通过最近两个多月的系统分析和快速验证，我们非常有信心实现ChatGPT类似的技术阶跃进步，并在中文认知智能领域达到国际领先水平。”

为了进一步提高大模型在细分行业的实用性，刘聪说，讯飞计划采用“1+N”架构，其中“1”是通用认知智能大模型算法研发及高效训练底座平台，“N”是应用于教育、医疗、人机交互、办公、翻译、汽车、工业等多个行业领域的专用大模型版本。例如，通过学习海量医学教材、论文和病例，实现专业的医疗领域对话式AI系统，打造“每个医生的AI诊疗助理，每个人的AI健康助手”。

此外，讯飞也非常希望基于认知大模型与各行各业的伙伴们在企业数字化、行业内容生产等方面开展深入合作，基于行业数据与知识，形成智能化定制解决方案。我们的技术底座和行业积累合力共赢，能助力合作伙伴跨越认知智能技术壁垒，提高产品竞争力，实现协同创新，共同加快行业转型升级，推进数字中国建设。

此外谈及资本市场当前的热潮，刘聪认为，全球资本都在ChatGPT的技术突破后看到了人工智能对社会产生的重大产业机遇，众多行业都有被深度重构的机会，重构过程中一定会产生巨大的全新商业价值，因此资本市场的兴奋是可以理解的。

但是我们要踏踏实实把科研做好，把产品做好，把服务做好，最终还是要回到人工智能红利能否兑现的三大标准：“有没有看得见摸得着的真实应用案例，有没有能够规模化推广应用的产品，有没有统计数据能够证明的应用成效”，只有这些才能够经得起时间的考验，才能够真正把人工智能做实做透。

科大讯飞刘聪：由ChatGPT浪潮引发的深入思考与落地展望