星环科技成功举办数据要素市场与大模型语料库论坛
2023全球数商大会于11月25-26日在上海成功举办,活动期间共举办1场开幕式、1场主论坛、1场数据交易节及20场主题论坛。11月26日,由中国大模型语料数据联盟指导,上海数据交易所、星环信息 科技 (上海)股份有限公司主办,上海市数商协会协办的“数据要素市场与大模型语料库论坛暨中国大模型语料数据联盟开放日活动”成功举办,活动上200余家大模型数据、人工智能及技术企业及相关机构代表出席会议。
上海市经信委信息化推进处处长钱晓致辞表示,大模型发展到现阶段,高质量的语料数据尤为的重要。在政策引领方面,11月,上海经信委发布了《上海市推动人工智能大模型创新发展若干措施》,推出11条措施。推动大模型预训练模型创新发展,着力支持大模型创新能力,提升创新要素供给能级,推进大模型创新应用,营造一流创新环境。在生态建设方面,今年上海成立了中国大模型语料数据联盟,旨在通过链接模型训练、数据供给、学术研究、第三方服务等多方面,机构联合打造国际化开放性的大模型语料数据生态。
本次活动上,上海市新能源 汽车 公共数据采集与监测研究中心、华院计算技术(上海)股份有限公司、星环信息科技(上海)股份有限公司、上海市人工智能行业协会、上海稀宇科技有限公司、上海四维数邦数字科技有限公司、上海世纪出版(集团)有限公司、上海第二工业大学、上海市人民检察院、瑞因凡(上海)智能科技有限公司、北京晴数智慧科技有限公司、北京清博智能科技有限公司12家新成员单位加入“中国大模型语料数据联盟”,将共同为大模型技术深度发展与高水平应用提供更多元的数据要素保障。上海人工智能实验室生态中心负责人,合作交流与知识产权部部长王宇,人民网上海频道总经理金煜纯为各单位颁发了入盟纪念证书。
为推动大模型技术快速发展,供给丰富且高质量的开源数据,本次活动中,由市统计和大数据研究院、上海图书馆(上海科学技术情报研究所)、上海仲裁委员会三家单位共同发布专业数据集,涉及上海统计年鉴数据集、中国家谱总目数据集和国际仲裁法律、规则与实践数据集,数据模态丰富。
随着数据的爆炸式增长,数据安全和隐私保护问题日渐重要,数据治理在新时代的使命,不仅是对数据进行有效管理,更是要确保数据安全和隐私保护,今天的活动上由上海人工智能实验室和人民网两家联盟发起单位正式揭牌成立中国大模型语料数据联盟安全治理专委会,旨在推动大模型数据安全治理,保障大模型技术快速发展。
活动上,上海人工智能实验室生态中心负责人,合作交流与知识产权部部长,人民网上海频道总经理金煜纯。上海人工智能实验室治理研究中心副主任王迎春围绕《构建高质量的大模型语料数据生态》、人工智能治理及《生成式人工智能——合规性评估与语料库建设》发表了演讲。
未来,联盟将持续发挥好“朋友圈”作用,凝聚各方资源,发挥各成员单位优势,群策群力,共同推动大模型语料数据高水平供给,为我国大模型发展做好数据支撑。
论坛汇聚了各行业对大模型时代的思考,星环科技联合创始人,技术副总裁刘汪根、中金计算机首席分析师于钟海、上海数据交易所市场发展部副总经理章健、交通银行软件开发中心综合业务产品部副处长姚利虎、科大讯飞AI工程院副院长刘坤、上海财联社技术总监叶周发表主题演讲。
中国大模型语料库的价值与挑战圆桌对话环节,星环科技智能量化事业部总经理曾晨光主持,上海市 经济 和信息化委员会信息化推进处干部薛威、复旦大学大数据学院副院长阳德青、上海财联社技术总监叶周、上海数交所技术开发高级经理孙江,在主管机构、学界、数据机构、交易所视角共同探讨中国大模型语料库建设。