共话可信数据流通新生态,2022 GAITC可信数据流通智能技术应用发展论坛成功举办
11月27日,由中国人工智能学会、杭州市人民政府主办,开放群岛(Open Islands)开源社区、FATE开源社区具体承办,深圳数据交易所、华为云、金智塔 科技 协办的“2022全球人工智能技术大会可信数据流通智能技术应用发展论坛”成功举行。
香港科技大学计算机与工程系讲座教授和前系主任、中国人工智能学会(CAAI)荣誉副理事长杨强,上海交通大学讲席教授、日本工程院外籍院士李颉,恒生电子首席科学家、研究院院长、上海证券交易所原总工程师白硕,华为公司数据总架构师马运,复旦大学软件学院教授、副院长韩伟力,浙江大学人工智能研究所副所长、杭州金智塔科技首席科学家郑小林,深圳数据交易所副总经理、董事王冠,上海数据交易所副总经理、上海大数据应用创新中心主任卢勇,北鹏前沿科技法律研究院理事、副院长、开放群岛(Open Islands)开源社区法律合规工作组组长王青兰等10余位专家学者、企业代表出席会议并发表主题分享。
聚焦可信数据流通技术应用发展,促进数据价值释放
在主题分享环节,出席嘉宾分别从如何高质量挖掘数据价值,构建安全、合规、可信的数据流通体系、底层技术创新等方面进行深入讲解与交流,多角度阐述了可信数据流通智能技术与数据要素交易体系建设实践,为数据要素可信流通与应用开阔了思路。
恒生电子首席科学家、研究院院长、上海证券交易所原总工程师白硕从稀缺性技术视角,分享了元宇宙虚拟物的流通痛点。白硕认为,虚拟物的互联互通才是元宇宙的本质特征,只有在顶层设计、互联互通互操作协议层面取得重大进展,元宇宙才会有实质性创新。
白硕表示,谈论元宇宙互联互通,不仅是虚拟物的互通,也需使虚拟物所承载的权益互通。而虚拟物的表现形态为数据,虚拟物的交易流通本质上是数据的交易流通,稀缺性的技术支撑,能够为虚拟物实现定价与赋权,成为虚拟物漫游、拼装、改造的核心要素。“懂得通过组装数据‘碎片’形成价值较高的数据产品,才能在数据要素的定价中找到自己的增值点。”白硕总结道。
复旦大学软件学院教授、副院长韩伟力介绍了安全多方学习技术的最新进展与未来发展方向。韩伟力表示,数据要素可信流通的关键是在数据安全与数据价值释放间取得平衡。数据通常分布在不同机构,且受到法律法规的保护,如何在数据可用不可见的前提下,充分利用不同机构数据,并训练为高性能机器模型成为一个关键挑战。
据韩伟力介绍,基于安全多方计算(MPC)实现的隐私保护机器学习的技术、框架与平台等安全多方学习(MPL)应用,目前其团队开发出了国内高校首个开源安全多方学习平台。该平台实现了基于Shamir秘密共享、加法秘密共享、向量空间秘密共享协议的多种安全多方计算算子,以及安全多方统计分析和线性回归、逻辑回归、BP神经网络等主流机器学习模型的训练。其中PEA模型实现了多方数据共享场景下的训练过程的可证明安全和训练结果的可度量安全,pMPL框架中引入的特权方设置突破了当前基于安全多方计算的机器学习中所采用的对等结构不符合常见 商业 场景这一根本性缺陷。因此FudanMPL可以支撑起 金融 风控、智慧医疗等隐私敏感场景的数据协作需求。未来,伴随与不同安全模型的适配、安全性的可证明与可度量、与联邦学习加速融合,以及通过标准化实现与其他隐私计算框架的互联互通,安全多方学习将迎来进一步发展。
北鹏前沿科技法律研究院理事、副院长、开放群岛(Open Islands)开源社区法律合规工作组组长王青兰根据数据要素合规服务的创新与实践经验,介绍了数据要素流通科技合规服务体系的新范式。王青兰表示,数据要素开发利用的前提是合规,随着立法的完善与监管效率的提高,数据要素流通的合规性门槛逐渐提升。
王青兰认为,标准化、智能化、场景化的合规服务创新,将成为平衡数据合规与数据利用的关键路径。据王青兰介绍,目前北鹏前沿科技法律研究院已经形成个人信息保护法律合规智能评估系统,该系统可快速针对企业应用场景提供智能评估报告,帮助企业在满足监管合规前提下,促进数据的开发利用。
同时,北鹏前沿科技法律研究院也与深圳数据交易所深度合作,成立开放群岛(Open Islands)开源社区的法律合规工作组,并在由百度云、FATE开源、开放群岛开源社区、京东科技、腾讯云共同发起的隐私计算开源协同计划中组建了法律合规团队,共同探索建立数据要素的开放创新生态,落地符合产业需求的数据流通合规指南。
推进政务公共数据市场化配置与融合应用,探索“一体化”协同创新
在圆桌讨论环节,浙江大数据交易中心总经理沈旭东,湖州市数字集团总经理王震,科大讯飞智慧城市事业群副总裁、讯飞大数据研究院院长谭昶,贵阳大数据交易所总助兼市场部总经理黄煜,FATE开源社区运营专委会主席、开放群岛(Open Islands)开源社区委员会运营组组长潘菲等与会嘉宾,以政务公共数据市场化配置与融合应用为主题,围绕政务公共数据流通共享的背景及内涵,政务数据治理、交易体系建设重点、难点、关键技术及驱动数据与场景协同创新等议题进行了热烈讨论。
浙江大数据交易中心总经理沈旭东表示,政务公共数据是政府部门履行职能过程中产生或使用的重要资源,蕴藏难以估量的 经济 发展、社会运行以及国家战略价值。实现对政务公共数据的精细化运营在数据要素市场培育过程中将起到重要的引领与示范作用。对政务大数据一体化而言,技术并非主要的制约和挑战,更关键的可能是区域治理机制间的差异。就浙江本地而言,浙江的数字化改革、数字经济发展程度在全国是名列前茅的,这对于我们发展数据交易、数据要素市场化是一个优势。目前,浙江省已建成省市区(县)三级数据一体化、智能化公共数据服务平台体系,这对接下来的政务数据应用发展而言,将会是一个先发优势。
湖州市数字集团有限公司总经理王震分享了湖州市在政务公共数据流通领域的探索和建设成果。王震表示,湖州是“绿水青山就是金山银山”理念的诞生地,地处长三角的地理中心,被纳入上海都市圈和杭州都市区范围,在数据要素流通特别是绿色低碳领域已有较多经验和成效,将为“大数据”与“双碳”两大国家战略深度融合提供有力探索和支撑。
同时,王震也表示,当前数据要素市场还处于初始阶段,实用制度建设、市场内生动力等方面还存在一定挑战。从近期湖州四大绿色数据领域对接的银行机构、竹林碳汇、电碳等场景方诉求来看,如何制定灵活、符合行业特点的制度,并根据场景需求进行针对性的数据开发,探索出数据生态高效协同的落地路径,将是提高地区政务数据开放共享规模与市场内生动力的重要举措。
科大讯飞智慧城市事业群总副总裁、科大讯飞大数据研究院院长的谭昶介绍了科大讯飞参与安徽数字政府、智慧城市建设经验。据谭昶介绍,科大讯飞参与了安徽省数据局江淮大数据中心的建设。通过采用“1+16+N”架构,即1个省级总平台,16个地市平台,以及N个部门的分平台。目前已连接了57个省直的部门,总体汇集的数据也已经达到了230亿条,数据共享交换累计数量已达到5600亿条。
据谭昶介绍,目前,安徽已成立数字安徽集团支持全省政府信息化建设,并与科大讯飞建立了羚羊工业 互联网 平台,在工业互联网以及企业工业数据应用方面,将科大讯飞的人工智能、大数据技术优势和安徽省先进制造业,智能网联,白色 家电 等等行业紧密结合,支撑安徽省大型企业或者中小型的企业数字化转型。
贵阳大数据交易所总助兼市场部总经理黄煜介绍了贵阳大数据交易所在数据治理、流通运营等方面探索。贵阳大数据交易所总助兼市场部总经理黄煜表示,公共数据运营的关键是从场景出发,形成按贡献决定价值的收益共享机制。贵阳大数据交易所成立于2015年,是全国首家以大数据命名的交易所,依法依规面向全国提供高效便捷、安全合规的市场化数据流通交易服务。
黄煜表示,根据贵州省公共数据的特色优势,我们提供了整个企业数据和公共数据融合的场景和平台,从而来挖掘更多的数字经济新产业和新模式。其中云上贵州公司作为贵阳大数据交易所数据商,依托贵州政务云创新模式,实现了全省省级部门政务数据的汇聚,通过场景和业务需求挖掘数据产品和服务,从数据共享开放、清洗加工、开发利用、流通交易,形成数据全生命周期产业链。目前已在贵阳大数据交易所已经上架了23个政务公共数据产品,其中包含了公积金,社保,不动产,税务,婚姻,公共资源交易等,涉及的场景有劳务用工,公共资源交易和普惠金融。
FATE开源社区运营专委会主席、开放群岛(Open Islands)开源社区委员会运营组组长潘菲表示,随着国家政务公共数据共享交换平台的建设,政务数据流转日益频繁,且呈现出从有限流动到广泛流动的新特性。
因此,在数据要素市场培育过程中,既需要技术专家的创新支撑,持续探索联邦学习、隐私计算、 区块链 等数据保护前沿科技应用;也需要法律专家在可信标准、法律法规的角度予以引导协同;同时,也要连接更多数据流通相关的数据管理部门、各地数据交易所等交易规则制定方,设计制定更具包容性、更具生命力的市场规则,共同构建一个有章可循,有规可依的数据流通交易生态。