国家数据局局长刘烈宏首谈人工智能高质量发展
日前,2024中关村论坛系列活动——第二届北京人工智能产业创新发展大会举办。会上,国家发展改革委党组成员,国家数据局党组书记、局长刘烈宏受邀发言,分享了他基于数据和算力等角度对人工智能高质量发展的一些思考,并表示下一步,国家数据局将把握数字化、网络化、智能化发展的趋势,大力推进数据资源的整合共享和开发利用。
让数据成为人工智能发展的催化剂
刘烈宏指出,2023年,以ChatGPT为代表的生成式人工智能在语言对话领域率先取得巨大突破,并陆续在计算机、生物、化学等领域取得显著进展。国内诸多企业相继推出大模型及相关的产品,并在互联网服务和行业数据化场景中加速落地,展现出巨大的应用前景。2024年2月,视频生成大模型取得突破性进展,引起全球广泛关注和讨论。大模型技术具有规模扩展性强、多任务适应性、能力可塑性强的特点,并仍在快速迭代、持续研究,有望成为通用人工智能的可行路径之一。
刘烈宏指出:“我们要充分发挥数据的基础资源作用和创新引擎作用,构建满足人工智能发展需要的数据开放、共享、流通、交易的模式,全面提高数据资源开发利用水平,让数据‘供得出、流得动、用得好’,真正成为人工智能发展的催化剂,推动做强、做优、做大数字经济。”
刘烈宏表示,将数据作为生产要素,是我国首次提出的重大理论创新,这也为我们抢抓人工智能战略机遇奠定了坚实的基础。大模型驱动的人工智能发展对于高质量数据供给提出了更高要求,数据要素的市场化配置和开发利用显得尤为重要。我们要充分发挥数据的基础资源作用和创新引擎作用。
刘烈宏首谈人工智能高质量发展
大会现场,刘烈宏分享了他基于数据和算力等角度对人工智能高质量发展的一些思考。
高质量数据是人工智能发展的根基。
在他看来,高质量数据是人工智能发展的根基。人工智能技术的历次突破都离不开高质量数据集的支撑。
回顾历史,由七万张手写数字图片组成的数据集,促进了图像识别领域的发展,快速推动了数据自动分类和聚类技术的发展;由1400万张各类互联网图片组成的数据集开启了深度学习的时代,极大地提升了人工智能感知技术的能力;由自然语言、编程语言、网络数据等组成的万亿级多模态高质量数据级开启了大模型时代,人工智能开始具备一定的认知交付能力,使得机器认知,甚至通用智能成为可能。
刘烈宏指出,今天数据的“质”和“量”是推动大模型不断进步的关键。例如,在前提条件不变的前提下,使用更高质量的数据集来做训练,能使20亿参数量级的模型超过100亿参数量级的模型。
高性能算力是人工智能发展的基础。
高性能算力是人工智能发展的基础。刘烈宏认为,面对生成式人工智能服务和大模型的迅速兴起带来的旺盛的算力需求,需要从算力供给和算力网络调度等方面来做好统筹协调。从算力供给来看,需要加大低成本、高质量、易使用的算力供给;从算力网络的调度来看,需要做好人工智能、模型训练推理、离线分析等高时延业务等资源匹配,切实提升计算资源的整体使用率。
2023年12月,国家数据局联合有关部门共同印发了《深度实施东数西算工程加快构建全国一体化算力网的实施意见》,从“通用算力、智能算力、超级算力的一体化布局”“东中西部算力一体化协同”“算力数据算法一体化应用”“算力与绿色电力一体化融合”“算力发展与安全保障一体化推进”等五个统筹出发,推动建设联网调度、普惠易用、绿色安全的全国一体化算力网。
行业应用是人工智能落地的关键。
刘烈宏指出,行业应用是人工智能落地的关键。“我国超大规模市场为人工智能行业应用提供了丰富的土壤,这是我国推动人工智能应用迈向更高水平的重要优势。”刘烈宏说道。
例如在交通物流行业,人工智能技术应用可以助力企业提升运输效率,降低全社会物流的成本;在文化旅游行业开发文化大模型,能够贯通各类文化机构的数据中心,充分挖掘文化数据的价值;在科技创新领域以科学数据支撑大模型的开发,可以更深入地挖掘各类科学数据和科技的文献。
国家数据局与16个部门共同印发《“数据要素×”三年行动计划(2024—2026年)》,提升数据利用水平,推动人工智能行业应用落地,推动社会各界共同挖掘市场的需求。这为人工智能技术的行业应用奠定了基础。
安全治理是人工智能发展的保障。
另外,刘烈宏还指出,安全治理是人工智能发展的保障。人工智能在对经济社会发展带来深远影响的同时也蕴含着隐私保护、算法安全、设施安全和技术耐用等潜在的风险隐患。
目前,国内多家企业已经设立了数据伦理安全委员会,积极落实行业自律,并取得了初步的成效。“在此基础上,我们还应该多维布局,汇聚政府、行业、企业等各主体,从科技伦理、立法、技术实践等维度推动人工智能安全治理,坚持创新发展和安全治理统筹原则,持续优化完善人工治理安全风险的防范。”刘烈宏说道。
保障体系是人工智能发展的支撑。
最后,保障体系是人工智能发展的支撑。人工智能高质量发展离不开人才的建设、标准规范和国际合作等保障体系。其中复合型人才是发展的强效动力,需要以社会需求和产业发展为导向,培养兼具理论和实践,掌握数据、算法、分布式计算等技能的跨专业人才队伍。
“统一的标准规范体系是发展的重要基础,需要构建关于人工智能数据、算力和算法的标准体系,有效提升高质量数据和高质量算力的供给。”刘烈宏表示,“开放的国际合作是发展的必经之路,需要积极开展人工智能国际合作,打造互联互通、互利共赢的人工智能的命运共同体。”
刘烈宏表示,下一步,国家数据局将把握数字化、网络化智能发展的趋势,大力推进数据资源的整合共享和开发利用,让数据赋能人工智能的发展,让数据真正实现“供得出、流得动,用得好”。同时打造全国一体化的算力调度体系,加速算力的高质量发展。
三部门共同研究提升“东数西算”网络传输效能
3月1日晚,国家数据局公号发文称,国家数据局等三部门共同研究提升“东数西算”网络传输效能。
文章说,近日,为深入贯彻党中央、国务院决策部署,加快落实《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》,国家数据局会同国家发展改革委、工业和信息化部围绕充分发挥“东数西算”网络传输效能,进一步提高企业网络传输性价比,听取国家枢纽节点企业、数据传输需求企业,以及电信运营商等方面的意见建议,研究建立专用于国家枢纽节点间的公共传输通道,有效提升“东数西算”网络传输效能。
文章披露,下一步,国家发展改革委、国家数据局、工业和信息化部将引导中国电信、中国联通、中国移动等企业加强创新探索,近期将在部分枢纽节点间试点开通“东数西算”的“公共传输通道”,探索采用多种服务方式,增强普惠易用水平,切实提升企业主体获得感。
“东数西算”工程自启动以来,国家政策支持力度不断加强,《数字中国建设整体布局规划》《算力基础设施高质量发展行动计划》等一系列重磅政策措施的发布,加强算力、数据、算法协同应用,算力得以更快地走进千行百业。
据中国信息通信研究院测算,算力每投入1元,将带动3元至4元的GDP经济增长。加快算力建设,将有效激发数据要素创新活力,加快数字产业化和产业数字化进程,催生新技术、新业态、新模式,实现对经济发展效能的放大、叠加、倍增作用。
AI的“三驾马车”:数据、算法、算力
人工智能是新一轮科技革命和产业变革的重要驱动力量,数据、算法和算力被公认为人工智能的三大核心要素。
数据是人工智能发展的基础。人工智能领域作为一个数据密集的领域,离不开数据的支持,其发展以海量数据作为基础,数据越多越优,场景特点越丰富,算法性能越高,模型也就更高效。
算法可比喻为人工智能发展的大脑。是通过一系列人工智能算法,比如机器学习从海量数据中获得规律,并利用规律对位置数据某些特性进行预测与判断,是处理数据信息的规则与方式。
算法是实现人工智能的根本途径,是挖掘数据智能的有效方法。当前,以深度学习为代表的算法快速发展拉开了人工智能浪潮的序幕,在计算机视觉、智能语音、自然语言处理、生物特征识别等领域广泛应用,相继超过人类识别水平。
在数据、算力和算法的进步与驱动下,近年来人工智能商业成熟度不断提升,行业进入加速发展阶段。与此同时,人工智能与传统产业的融合发展,彰显出了巨大的市场潜力,吸引了包括国内外科技巨头、解决方案及设备供应商、传统行业龙头企业以及人工智能企业等各类企业,积极参与到各个层面及细分领域的发展布局和市场竞争中。
根据毕马威发布的《人工智能全域变革图景展望:跃迁点来临(2023)》显示,从全球范围来看,人工智能企业数量经历了由爆发式增长转入稳步增长的阶段变化。从2017年开始,全球当年新增AI注册企业数量逐年下降,已从2017年的3714家下降到2022年的1106家。
图2:全球人工智能独角兽企业按国家分布情况
数据来源:毕马威分析,中关村产业研究院
中国人工智能领域企业密集诞生在2015年至2018年之间,约三分之二的人工智能领域核心企业成立年限在5-10年,随着有效投资增长乏力,人工智能领域新增注册企业数量在2017年达到峰值528家后,逐年下降,到2022年新增注册企业数减少至63家。
图3:2013年-2022年中国年度新增AI注册企业数量
数据来源:毕马威分析,中关村产业研究院
结合区域布局来看,中国人工智能企业主要集聚于北京、广东、上海、浙江等地,形成京津冀、长三角、粤港澳三足鼎立的格局,其中北京市人工智能企业数量有1,600余家。从人工智能独角兽企业来看,北京市有41家,位居全国首位。上海市和广东省数量位列二、三,分别有24家和23家。
当前我国人工智能产业加速发展,从基础支撑、核心技术到行业应用的产业链条基本形成,一批创新活跃、特色鲜明的创新企业加速成长,新模式、新业态不断涌现,整体呈现蓬勃发展态势。政策支持、投资引导和巨头布局将推动中国AI 产业的结构调整,进一步扩大市场规模。根据国际数据公司IDC数据显示,2020 年,中国人工智能产业规模达到 68.36 亿美元,预计 2023 年将达174.68 亿美元,年复合增长率达到 40.52%。