TalkingData崔晓波:释放数据资源活力与价值,破题数字经济发展瓶颈
TalkingData创始人兼首席执行官 崔晓波
4月,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》(以下简称“意见”)正式发布,作为中央关于要素市场化配置的第一份重要文件,进一步明确了数据要素的地位与作用、市场化配置原则与发展方向。
随着大数据等新一代信息技术的快速发展,数据作为基础性与核心性资源的作用日益凸显,但是直到十九届四中全会,才首次明确提出“数据可作为生产要素按贡献参与分配”,这次在《意见》中进一步将数据与土地、劳动力、技术等要素并列,凸显了数据的地位和作用,对整个大数据行业是一个非常振奋人心的消息。
从数字 经济 整体结构来看,数据资源是大数据、人工智能乃至 区块链 等新一代信息技术不可或缺的基础性要素。目前我国在数据资源方面具有丰富的优势,通过“价格市场决定、流动自主有序、配置高效公平”的市场导向型平台,将进一步释放数据资源的活力与价值,有助于我国数字经济的整体健康、持续发展。
数据要素市场目前面临的主要挑战包括:
一、数据处理方面的挑战: 互联网 时代的数据大多是结构化数据,像日期、电话号码、财务金额等等。而进入移动互联网以及物联网时代,由于智能设备、传感器的高速发展,产生大量的多 媒体 以及生物特征数据等非结构化数据。如何处理、管理和运用这些数据,将是面临的主要挑战之一。
二、数据应用方面的挑战:为了加速数据要素资源的高效配置,应用思路需要明确。将分散的数据孤岛聚合成多维度的数据资源,才能释放出作为生产要素的重要价值;而数据的融合应用要强调连接,而不是拥有。明确政府对于数据匹配体系的主导定位和责任,并鼓励 科技 公司的灵活应用和创新,让数据在各行各业实际应用场景中发挥价值。
三、数据安全保护与可持续利用方面的挑战。数据安全包含两大方面:首先是合法合规性;其次是数据和隐私信息的安全性。在逐步完善法律法规的同时,更要积极借助技术手段保障数据安全,例如运用区块链技术保护信息传输过程的安全;或基于“数据不动、算法流动”的理念,通过联合建模、联邦学习等人工智能技术从数据中提取价值,从根本上杜绝数据移动带来的安全风险。
《意见》出台的颇为及时,目前数据要素市场配置存在着数据要素资源与数据场景应用之间的不平衡,一方面数据要素主要被互联网等行业的头部企业掌握,依靠企业内的场景形成应用闭环;另一方面政府也拥有丰富的数据要素资源,然而缺乏深入的应用场景构建以及成熟的数据连接体系与技术能力。而科技企业很难有效参与其中,将前沿科技广泛落地到不同的场景应用中,这在一定程度上限制了中国创新和 创业 发展。《意见》的出台必将促进数据要素和应用场景的加速融合,明确民营科技企业的平等竞争地位,将加快中国整体数字智能化转型的进程。
联系到最近的新基建发展计划,数据要素市场化的探索与完善,将为新基建的数据中心、5G、工业互联网进一步发展提供引擎,两者相辅相成,共同为实现社会经济发展的总目标提供动力与支撑。
一、《意见》明确提出要“推进政府数据开放共享”,是数据要素市场化配置的重要切入点
目前国家已经初步建成政务信息资源共享交换体系,通过互联网+政务服务与互联网+监管,以应用促进互通、以数据提升服务,取得了初步的效果。政府数据开放共享是重要的起点和切入点,可以极大地释放占数据总量80%的数据资源价值,增加数据生产要素的供给,促进生产方式的变革,进一步提高数字经济的生产力。
依托在数据能力、产品技术能力、解决方案与方法论以及落地实践方面积累的经验,TalkingData近年来也积极与政府机构一起探索大数据在人口统计、新基建、普惠 金融 、智慧旅游等智慧城市和公共事业领域的共享与应用,通过政府数据的进一步开放共享,为公众与企业提供更高质量的数据服务。
二、《意见》深刻提出“提升社会数据资源价值”,通过规范场景与标准化采集进一步破解流通难题
企业是数据生产、加工与消费的活力主体,目前整个大数据行业还缺乏有效的社会数据互联互通的技术、机制与平台,对“多方安全计算”、“联邦学习”、“同态加密”等创新技术的探索,尚未从全局与根本上解决制约社会数据有效流通的瓶颈问题。因此,在相关行业领域通过规范场景、以协会为依托标准化数据采集是很好地发力点,可以进一步破题解决行业的关键制约因素和堵点。
数据采集及开发的标准化和规范化是数据行业有序发展的重中之重。首先,针对“数据采集的标准化”, TalkingData对欧美的相关法规进行大量研究后发现,像欧盟《通用数据保护条例》(即GDPR)中经常提到一个概念——数据的可携带权,就是指不同平台之间的数据在格式上是统一的,并可实现数据在不同主体间的转移,目的是促进数据的自由无障碍流通;而二十一条提出“数据采集的标准化”,将很好地助力实现国内的数据自由流通,这尤其对无人驾驶及机器学习领域将具有重要意义。
而“数据开发的规范化”, TalkingData更多从保护数据安全角度去理解,并且持续在努力践行及推广。数据开发的规范化,要求企业具备必要且充分的网络安全技术措施和完善的管理制度,以确保个人信息的安全。安全合规是整个行业发展的根本,也是TalkingData坚持的核心价值观,除了在自身技术能力和产品安全方面注重数据安全及合规,也积极响应国家标准制定及并加入多个行业协会,包括参与了全国信息安全标准化技术委员会发布的《信息安全技术个人信息安全影响评估指南》的编制工作,同时也是《信息安全技术 数据安全能力成熟度模型》应用推广试点单位。
三、《意见》创新提出“数据资源整合和安全保护”,进一步促进在安全、可控、合规的基础上加速数据融合应用
与传统的要素资源不同,数据资源具有“越使用价值越高”、“越融合价值越高”的特点,政务数据和社会数据的有机融合更有利于发挥数据的价值,可以更好地满足政府的管理需求和企业的业务需求,而其中的标准化与规范化可以极大地减少数据关联融合过程中的处理成本,加速数据融合分析利用的进程。
在发展过程中,TalkingData在多源数据安全融合与可信分析利用方面积累了大量经验,同时发展了基于“统一数据标识”的关键技术,可以在保护用户隐私的情况下进行多源数据的关联计算与融合分析,为政府和企业提供更多的实效支撑。
针对当前的“新基建”热点,TalkingData与国研经济研究院携手,快速完成了基于公开数据与行研数据融合的“新基建大数据平台”,面向行业主管部门、媒体与公众提供可公开访问的总 投资 、资金来源、地域分布、行业分布等多个维度的数据洞察,并以可视化交互形式进行呈现,便于直观地查阅。结合多源数据实现效果与效能的比较,可以更好地在总体、区域、行业以及具体项目上,为相关决策者和执行者提供可靠的数据支持。
在人口统计领域,TalkingData同国家统计局联合成立人口统计大数据实验室,借助移动端大数据,从更多维度、更加及时揭示和反映人口的分布、流动特征以及变化趋势,对传统人口统计数据进行丰富和补充。面对此次突发的新冠肺炎疫情,TalkingData借助一套“数据+模型+可视化+报告”的整体解决方案,实现了对北京市的各区人口及区域间、省际间人口流动的动态监测,以及重点区域的疫情监测。
在智慧文旅领域,TalkingData与文化和旅游部信息中心共同成立“文化和旅游部综合监测与应急指挥平台大数据分析与挖掘联合实验室”,提供覆盖全国文化与旅游相关产业的全面、丰富的数字化分析能力,为研究全国产业分布及发展情况、游客人群精准画像等重点领域提供有力数据智能支撑。
此外,TalkingData还与中关村大数据产业联盟共同发布了“数据标识互联示范应用”(简称“数联网”)。“数联网”是国家大数据战略总体工程的基础性示范项目,旨在不改变现有数据管理格局、不改变数据权属和保护个人隐私的情况下,形成完整的社会数据资源,并满足大数据在国家安全、社会治理、经济发展等方面的应用需求,将作为行业基础性的应用产生广泛影响。
《意见》的及时出台,为大数据行业的发展奠定了坚实的制度基础,提供了有力的政策保障。随着数据要素市场化配置机制的逐步建立,将极大促进大数据技术、产品与应用的发展,并为人工智能、区块链等新一代信息技术产业的融合发展、集群应用提供基础性、战略性与核心性资源保障,也将为打造新型数字经济提供强大的发展动力。