2022中国大模型发展白皮书
随着数字化转型需求增长,AI在企业中的应用也越来越多,AI开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题成为AI规模化落地的挑战,而预训练大模型的出现则为人工智能带来了新的机遇与希望。
大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、迁移性方面都表现出显著优势和巨大潜力。
IDC预测:
未来大模型将带动新的产业和服务应用范式,在深度学习平台的支撑下将成为产业智能化基座,企业需加快建设人工智能统一底座,融合专家知识图谱,打造可面向跨场景或行业服务的“元能力引擎”。
具体来看:
大模型具有良好的通用性、泛化性,显著降低人工智能应用门槛。
预训练大模型在海量数据的学习训练后具有良好的通用性和泛化性,用户基于大模型通过零样本、小样本学习即可获得领先的效果,同时“预训练+精调”等开发范式,让研发过程更加标准化,显著降低了人工智能应用门槛,成为AI走向工程化应用落地的重要手段。
深度学习平台为预训练大模型的发展保驾护航,两者结合夯实了产业智能化基座。
深度学习平台是推动产业智能化转型升级的核心载体,为大模型的算法开发、训练、部署保驾护航。大模型加上深度学习平台,贯通了从硬件适配、模型训练、推理部署到场景应用的AI全产业链,夯实产业智能化基座,将加速产业智能化升级。
大模型在推进产业智能化升级中已表现出巨大潜力,企业应该尽早关注。
大模型目前的产业应用包括面向企业提供AI中台基座、深度定制支持产品或生产的优化与创新、开放模型服务等。大模型已经在搜索、推荐、智能交互、AIGC、生产流程变革、产业提效等场景表现出巨大的潜力,企业应该尽早关注,在业务中布局。
未来还需加强大模型与真实场景需求匹配,推动大模型大规模落地。
目前中国大模型厂商在模型布局方面较为完善,应进一步围绕行业赋能的广度和深度持续探索,不断夯实基于大模型的产品建设,推动大模型技术从实验室走向实际大规模落地。
大模型未来发展趋势
大小模型协同进化,推动端侧化发展。
未来几年,大模型和小模型将会协同推动人工智能的发展,实现明确分工,高效率低成本地解决业务问题。
大模型负责向小模型输出模型能力,小模型更精确地处理自己“擅长”的任务,再将应用中的数据与结果反哺给大模型,让大模型持续迭代更新,形成大小模型协同应用模式,达到降低能耗、提高整体模型精度的效果。
大规模参数并不是产业所追求的重点,更少的标注数据依赖、更优的模型效果、更高的模型性能以及便捷的部署方式将是未来研究的重点。
大模型通用性持续加强,实现AI开发“大一统”模式。
大模型由于其泛化性、通用性,为人工智能带来了新机遇。通过无标注数据进行自监督学习,从而降低标注数据的人力要求,GPT-3、文心大模型均展示出了在未标记数据中的学习成果,并展示了在不同任务与行业领域上的通用性。
同时,多模态大模型也逐渐兴起,数据形态差异化问题也将得到解决,未来大模型将进一步致力于构建通用的人工智能底层算法框架,融合多领域的模型能力,在不同场景中“自我学习”,通过一个大模型解决产业中各种问题。
目前,在通用模型的基础上,各行业正利用精调或prompt的方式加入任务间的差异化内容,从而极大地提高了模型的利用率,推动AI开发走向“统一”。
大模型从科研创新走向产业落地,通过开放的生态持续释放红利。
大模型最重要的优势,是推动AI进入大规模可复制的产业落地阶段,仅需零样本、小样本的学习就可以达到很好的效果,以此大大降低AI开发成本。
目前,我们看到大模型已经开始与领域、行业深度融合,例如,工业质检、蛋白质结构预测等领域的大模型,验证了大模型已不仅在科技企业中应用,也迈出了走向各行各业的步伐。我们看到ChatGPT专注于强化内容创造能力,将生成式AI应用到实际业务中,为大模型带来新的产业落地机遇。
具体来看,微软已经宣布将会全线整合ChatGPT,将大模型嵌入搜索引擎和办公软件,进一步推动AI能力的全面赋能和产业落地。开放、开源是技术逐渐成熟和规模化输出的象征,随着大模型的落地,头部企业将开放技术,赋能中小企业,打造以大模型为底座的生态。
目前大模型的开放、开源还主要在算法、API服务、开发工具的使用上,未来需要打造标准算法集、大模型平台、大模型数据集等全栈化的开放生态,将大模型的红利释放给每个开发者,并促进大模型创新应用的出现。
具体内容如下 :
责任编辑:张薇