数篷专家说 | 可信数据空间架构设计
【前言】在快速发展的数据空间技术领域,持续的技术创新和知识分享对行业生态繁荣至关重要。"数篷专家说"是数篷 科技 公众号新设专栏,秉持内容的专业性、创新性、实用性原则,提供技术前沿实践洞察,分享行业趋势与典型案例。
本文聚焦可信数据空间的发展动态,探讨了数据安全基础设施、可信数据流通层和数据应用生态的三层架构设计,并对完善规则机制与协同模式、促进五类可信数据空间的发展进行了展望,为进一步促进数据要素的价值激活和生态繁荣提供有效参考。
【作者简介】
游武卫 数篷科技资深专家,主导设计实施可信数据空间解决方案,参与超大规模分布式安全管控平台的设计和开发,拥有1项数据共享及访问控制发明专利。
周丹 数篷科技战略规划专家,主导编写多本AI教材和产业报告,在核心期刊发表多篇文章。
近年来, “数据空间”、“可信数据空间” 的关键词热度不断提升,数据空间正成为全球建立数据共享信任机制、推动数据有序流通的有效解决方案,引起政府和产业界的广泛关注。日前,国家数据局就表示正着手推动数据空间的试点和试验,一是以数据为牵引,推动 企业、行业、城市、个人、跨境等五类数据空间 的建设,聚焦重点行业推动数据空间;二是围绕共性标准研制核心技术,建设数据基础设施并加强规范管理;三是加强国际合作,促进跨境数据的互联互通。
当前,由于缺乏可信的数据流通基础设施、缺乏标准化的数据共享机制,存在数据安全保护不到位、确权难、流通难等问题,数据各类主体“不敢用、不会用、不想用”的问题较为突出,数据要素的数据价值未得到充分释放。因此,有必要对 “数据空间”、“可信数据空间” 的概念价值、架构设计和实践落地进行深入讨论和快速推进。
图1 百度指数收录的“可信数据空间”词条的上升趋势
图2 国家数据局提出的“五类数据空间”
一、什么是可信数据空间?
国际数据空间协会(IDS)认为,在数据生态系统中, “数据空间” 是基于公认原则的可信数据共享和交换的去中心化基础设施,它提供了基于共同协议和格式的数据交换标准化框架,以及安全和可信赖的数据共享机制。Gaia-X协会认为, “数据空间” 是基于公共政策、规则和标准的联邦的、开放的主权数据共享基础设施。欧盟牵头开展的 “制造业数据空间” ,目前专项 投资 已超1700万欧元,其通过法案支持、试点推广等方式逐步推动空间落地,每一方都对数据存储和共享采用相同的高标准和规则。德国则以业务模式为驱动,同步推进标准化建设、监管框架、认证标签、开源等工作。不难看出,国际上更关注“数据空间、可信数据空间”的行业应用,侧重于数据共享、交换和协作的治理架构和平台。
我们认为, 可信数据空间(Trusted Data Matrix,TDM) 是在现有信息⽹络上搭建的共享、流通和应⽤的分布式关键数据基础设施,通过体系化的技术确保数据流通协议的确认、履⾏和维护,解决数据要素提供⽅、使⽤⽅、服务⽅等主体间的安全与信任问题,进⽽实现数据驱动的数字化转型,满⾜政府和企业对数据流转的需求,最⼤化发挥数据要素的利⽤价值。
可信数据空间为数据提供者提供出域后的控制能⼒,如数据适⽤对象、范围、⽅式等,消除流通顾虑,释放数据供给;为数据使⽤⽅提供数据要素流通的中间服务,便利供需对接,促进应⽤场景和数据价值化配置;同时,通过数据流通处理的⽇志存证,提供内外部合规记录,实现数据资源有效管理,保障数据流通全⽣命周期可信、可⽤、可控及审计。
图3 可信数据空间的多主体参与方
二、可信数据空间架构应如何设计?
“可信数据平台”的架构设计应遵循 “柔性设计、端云协同、动态适应” 的原则,“柔性”代表着弹性可伸缩、灵活适应能力强,基于软件定义的特点,无需前置的基建硬件投入,更加贴合大中小企业的实际应用场景,“柔性可信数据能力”意味着对于数据保护在安全可信的基础上更进一步,对市场需求和环境变化有更强的适应性和更高的鲁棒性;端云协同,注重覆盖端、云、边等多种应用场景,适用于各行各业,覆盖面更广;动态适应,则是在数据的不同生命周期按需提供随时随地的保护和协同能力。
可信数据空间是以数据安全基础设施为底座,通过可信数据流通层和数据价值中心运营中心等构建的全栈数据应用生态 。具体来说,①数据安全基础设施,聚焦基础设施的安全性建设,覆盖端、云、边不同形态,解决数据存储、计算、流转三⼤形态的安全问题,以满⾜企业内各类安全基线要求。基于身份构建软件定义的安全叠加⽹络,解决跨设备、跨地域、跨云以及开放环境下应⽤互访和数据传输安全。②可信数据流通层,提供领先的数据综合治理能力,保障数据安全、合规流转。数据安全基础设施与可信数据流通层都提供"数据安全流转"的能⼒,差异在于前者关注数据传输过程的安全性,而后者更关注数据内容本身。③数据价值运营中心,将数据转化为可实质进⾏交易的数据资产,具备辅助完成数据资产⼊表、数据交易、数据确权等所需的配套能⼒,提供⽀持场内场外数据流通运营的应⽤⽣态,有效促进产业生态数据的深度融合。
图4 可信数据空间架构图
三、五类可信数据空间展望
总体而言,可信数据空间应实现数据全生命周期过程的可信管控,实现数据在不同主体之间的可控流转,实现数据跨终端、跨网络、跨应用、跨组织的安全流通,促进行业上下游产业链生态的健康和可持续发展。
目前, 企业、行业、城市、个人、跨境等五类可信数据空间的划分,更多是规则制度方面的区分,而不是技术体系的区分 。企业可信数据空间能有效提升企业竞争力,并促进产业链上下游的协同发展,形成更具活力和竞争力的产业生态;行业可信数据空间能够打破信息孤岛,实现行业数据的互联互通;城市可信数据空间整合城市的人口、交通、能源、环境、教育、医疗等各类数据,实现城市的智能化管理和运行;个人可信数据空间则充分保障了个人的数据权益和隐私安全;跨境可信数据空间的建设,对于推动全球 经济 一体化和数字贸易发展具有重要意义,能够促进国际贸易、跨境电商、数字 金融 等领域的发展,实现资源的优化配置和全球产业链的协同合作。
未来,通过不断完善多元主体的全责任运营机制和组织协同模式,建立完善的数据治理体系;加强数据标准的制定和统一,提高数据的质量和价值,以有效解决数据交换、共享中的信任和安全问题;同时,不断实践孵化更多鲜活的应用案例,以市场反馈不断迭代理论体系,进一步促进数据要素的价值激活和生态繁荣。