数据开放成效初显,中国公共数据开放如何跑得长、跑得久?
5月25日,复旦大学、国家信息中心数字中国研究院、提升政府治理能力大数据应用技术国家工程研究中心在2023中国国际大数据产业博览会(简称“数博会”)上联合发布了《2023交通运输公共数据开放利用报告》,对交通运输领域公共数据开放利用的现状和水平进行评测。
报告显示,公共数据开放正成为交通运输领域升级转型的驱动力。随着交通运输行业的数字化转型进程加快,未来公共数据和人工智能等技术将共同推动交通领域的变革和效率提升。
那么,交通领域公共数据开放有何现实意义?其他行业的公共数据开放现状如何?中国未来在公共数据开放方面如何跑得长、跑得久?针对这些问题,数据观专访了复旦大学数字与移动治理实验室主任郑磊,励讯集团中国区高级副总裁张玉国,以及律商联讯风险信息中国区董事总经理戴海燕。
交通运输公共数据开放有效促进交通行业治理能力提升
作为国家经济命脉,交通运输领域生成和储存的公共数据内容丰富,应用面广,开放交通运输领域的公共数据对助推数字经济和数字社会发展具有重要意义。交通运输部在印发的《推进综合交通运输大数据发展行动纲要(2020-2025年)》(交科技发[2019]161号)中明确将“深入推进大数据共享开放”作为五项主要任务之一。2021年12月,交通运输部发布的《“数字交通”十四五发展规划》针对“行业成体系、成规模的公共数据较少,数据开放与社会期望还存在差距”的现状,提出“研究制定交通运输公共数据开放和有效流动的制度规范,推动条件成熟的公共数据资源依法依规开放和政企共同开发利用”。
据《2023交通运输公共数据开放利用报告》显示,截至2022年10月,我国已有208个省级和城市的地方政府上线了数据开放平台,共开放了283413个有效数据集。其中,有11个省级和96个城市平台共开放了9489个交通运输领域数据集。北京市、台州市等7个城市制定了专门针对交通运输领域数据开放的法规政策。
郑磊介绍,数据的有效利用是公共数据开放中的重要一环。各地为了促进交通运输领域的开放数据利用,开展了一系列利用促进活动,例如组织交通领域的行业小赛,在开放数据创新利用大赛中设置交通运输赛道赛题等,产出了一定数量的利用成果。这些利用成果主要覆盖了公交出行规划、停车场查询、交通政务服务、外卖配送、公路客运、公路货运、交通便利度评测、驾车路线规划、新能源充电桩查询、物流配送、航线查询等 11 个应用场景,其中,公交出行规划、停车场查询场景的成果数量最多,占全部利用成果的九成。
图片来源:《2023交通运输公共数据开放利用报告》
“交通运输领域可以通过开放数据来提高效率、提高安全性和减少成本,同时也为相关企业和机构提供更多发展机会和更好的营商环境。”郑磊表示。
戴海燕举例介绍,美国特拉华州数据开放平台(https://data.delaware.gov/)通过网络门户开放该州发生自2009以来到半年以前的交通事故数据,数据来源于该州社会健康与服务部门(DSHS,Department of Social Health and Services)公开发布的事故报告,包含45万行,37个数据项。该数据具有追溯性好、颗粒度细、可读性高的特点,每月更新一次。通过开放可进行数据分析,有助于识别潜在事故现场,评估危险道路,通过规划和改善来增强铁路、公路以及交叉口的安全。
“交通领域公共数据开放在车险端的应用可以带来非常正面的社会效应。”戴海燕谈到,一方面可以让车险的投保更加便捷,理赔更快更公正,从而使得更多的消费者投保商业车险,用保险杠杆避免了因为事故灾难而导致家庭不幸致贫,增加社会稳定性。另一方面车险公司可以根据被保险人的驾驶风险进行精准定价,从而使得更多的消费者为了降低来年保费,开车更加小心,从而有效地降低了自身事故风险,提升了道路安全。
各行业公共数据开放迫在眉睫
除了交通领域,推动开放经济发展、城市建设、教育科技、民生服务、企业服务等多个重点领域的公共数据实现其最大限度的开放共享、开发利用,对推进国家治理体系和治理能力现代化有着重要意义。
谈及对公共数据开放的看法,张玉国表示,在国际层面,数据是信息时代的核心资源,是国家竞争力的重要组成部分。其中,公共数据因为覆盖面广、数量大、价值高,往往比私营部门的数据更重要。目前,美国、欧洲、英国等很多国家都发布了国家数据战略,国家间的数据竞争将会很激烈。在国内层面,数据是建立国内统一大市场,服务民生、创造就业的重要领域。数据相关的产业将是国家高质量发展过程中产业迭代和新经济增长点中的一个重要领域。据有关部门统计,我国外卖骑手、快递员、网约车司机、网络主播等灵活就业的人数已经达到了2亿,这些行业的背后都需要大数据的支撑。
戴海燕同样认为,公共数据开放在社会管理方面不仅可以提升政府部门之间的治理协作能力,还可助力政府掌握社会运行过程中的相关内在规律,制定相关应对策略,在解决社会复杂问题方面,提供新的手段及方式,使政府防范社会风险的水平能够得以有效提升,促进社会实现稳定良性发展。
在社会经济方面,公共数据开放有助于促进传统经济运行机制得以改变,促使产业结构实现优化及调整,从而推动经济增值创新。
“公共数据开放的主角和决策者是政府机构和公共数据拥有者,但是企业也有责任。”张玉国介绍,励讯集团作为一家有百年历史、长期从事内容和数据分析业务的公司,励讯集团中国区近年来在多个方面积极推动公共数据开放:
展现数据价值。励讯集团通过国内外的场景和案例,展现公共数据被合理开放和应用,通过大数据分析挖掘,能够给社会和客户创造什么样的价值,尤其是在普惠金融、金融反欺诈、保险风控和寻找失踪人口等方面。
探索行业共治。大数据是新兴行业,新情况新问题层出不穷,例如平衡发展与安全,尤其是数据安全、隐私保护方面的问题。国家的公共资源是有限的,作为企业,这方面的问题不能依赖和等待国家,要主动探索行业共治。励讯集团在英中贸易协会(CBBC)的支持下,今年2月牵头创立了CBBC数字经济工作组,其中一个重要任务就是联合其它企业,探索行业共治。
广泛开展交流合作。励讯集团与多地、多部门、多机构开展了交流和合作。例如与复旦大学数字与移动治理实验室合作研究交通领域公共数据开放,与北京师范大学相关部门合作研究移动智能数据在保险领域的合规应用,与北京大学数字金融研究中心探讨美国公共数据开放的经验等等。同时还和北京、上海、深圳、贵阳等地大数据主管部门进行了密切的交流和沟通。
据复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院发布的“2022年度中国开放数林指数”,截至2022年10月,我国已有208个省级和城市的地方政府上线了政府数据开放平台,其中省级平台21个(含省和自治区,不包括直辖市和港澳台),城市平台187个(含直辖市、副省级与地级行政区)。目前,我国74.07%的省级(不含直辖市)和55.49%的城市(包括直辖市、副省级与地级行政区)已上线了政府数据开放平台,公共数据开放水平逐步提升。
但与此同时我国政府数据开放工作目前仍存在不协同、不平衡、不可持续、数据利用不充分等问题和挑战。例如,郑磊提到,在交通运输领域,开放数据的利用尚处于起步阶段,各地的利用促进活动类型仍较为单一,且利用主体主要为企业,个人、社会组织、高校等其他社会主体参与利用的程度不足。
中国公共数据开放如何持续推进?
放眼国际,国外在数据开放共享方面是否有值得借鉴的途径或做法?
张玉国表示,首先要改变“中国在大数据领域是落后的,西方发达国家是先进的”的错误观念,大数据领域可能是中国与发达国家“并跑”甚至“领跑”的少数领域之一。根据有关统计,在全球大数据和人工智能领域,市值最大的公司和独角兽企业,主要集中在中国和美国,欧洲少有。当你“并跑”和“领跑”的时候,就不能像跟跑的时候,前面有一个标杆和参照系。所以在大数据领域,更重要的是根据中国自己的情况,因地制宜地制定政策。放眼国际,结合中国的实际情况,有三个方面可以借鉴:
坚持用市场经济的思路发展和治理数据领域。在市场经济条件下,数据是生产要素,与土地、资本、技术、人才一样,必须要流转起来,其交易主要是市场行为,价格主要靠市场来定。目前,各地纷纷成立大数据局,出台数据相关政策,举办数据相关活动,上线公共数据开放平台,但相比欧美,“有效市场”还不够——数据作为生产要素还没有流动、交易起来,数据市场还没有形成。如果以菜市场打个比方,大数据的“厨师们”到了市场,能够采购的“食材”还非常有限。
坚持发展为主线,数据开放共享是常态而不是例外。英国脱欧之后,开始形成有自身特色的国家数据战略,其主管部长Oliver Dowden在《国家数据战略前言》中说:“我们的终极目的,是创立一套促进经济增长(pro-growth)、促进创新( pro-innovation)的数据治理制度”。英国将在国家层面设立首席数据官(Chief Data Officer)的职位,其首要任务就是促进政府公共数据的开放共享,打破数据孤岛。文件特别要求政府各机构要改变“不敢承担风险”(risk aversion)的心态,“数据开放共享是常态而不是例外”(data-sharing by default)。
建立注重实效的数据安全和隐私保护制度。英国国家数据战略提到,要建立“以结果为导向(outcome-focused approach)而不是打勾就算(tick box)的制度”。我们生活中经常会遇到这种情况,下载一个APP或登录酒店WiFi,都需要看冗长的数据安全和隐私保护条款,但实际上没有几个人认真看,而是直接打勾(tick box)。其数据战略也毫不留情地批评英国现行的《数据保护法案2018》(来源于欧盟GDPR)“过于复杂,单向立法、没有充分征求意见,直接导致企业要做大量的文书工作(excessive paper work),给企业带来大量负担,却没有给广大公民带来益处”,并计划对其数据监管机构“信息专员办公室(ICO)”进行改革,目标有两条:一是维护数据权益(upholding data rights),主要是防止个人信息被滥用。二是鼓励可信的、负责任的数据利用(encouraging trustworthy and responsible data use),主要是提高公众对分享利用个人数据方面的信任和信心。保护不是最终目的,利用好数据才是最终目的。
中国未来该如何进一步推动公共数据开放?张玉国提出了四点建议:
一是尽快突破“三不”(不敢、不愿、不会)。不敢是怕出事,不愿就是听说数据有价值,为什么要跟别人共享?不会是技术、人才和制度方面还没有完全做好准备。其中“不敢”(怕出事)是最大的困难。需要通过解放思想,勇于承担,理顺机制,从根源促进数据开放。
二是政府与公共数据拥有者也需要“激励”。目前数据治理体系中,对政府和公共数据拥有者的责任偏大,但激励不够。虽然公共数据来自公众,大家已经交了税,原则上不应再收费,但是,企业如果获取数据进行商业应用,就超出了公共服务的范畴。收费当然不是为了利润,主要是覆盖成本,不能让公共税收支付商业利用的成本。从心理层面考虑,各机构的数据开放共享部门就不再是一个纯粹的cost center(纯支出部门),内部也有一定的底气。同时这也形成一定的门槛,不是任何个人和机构都可以免费获取公共数据。
三是平衡发展与安全。发展和安全是鸟之两翼,车之双轮。回顾汽车发展的百年历史就会发现,最早的汽车是没有安全带和气囊的,也没有强制系安全带、高速路上车距至少200米等规定,安全规则和安全技术是随着汽车业的发展而逐步完善的,数据治理也是同样的道理。
四是摸着石头过河。当一件事看不准的时候,先“摸着石头过河”,先试试,成功了再推广,失败就总结教训。在公共数据开放领域,也要广泛开展试点项目、“数据特区”。另外,对新技术、新业态、新模式要有包容审慎的态度。
戴海燕认为,在公共数据开放上应以国家治理、社会公众、科研机构、企业组织等部门的实际需求为依据,来确定数据开放的范围和内容。同时,数据在开放过程中的标准化、可机读性、实时性和实际应用效益需要依靠可信赖的专业第三方公司来实现。
推动公共数据开放需要持之以恒,总结经验教训,不断完善相关机制。正如《中国地方政府数据开放报告》提到的,数据开放是一场马拉松,而不是速滑赛,不在于一个地方是否跑得早、跑得急,而在于这个地方能否跑得长、跑得久,能持续稳定地向社会提供优质数据,并坚持不懈地推动开放数据的开发利用。
责任编辑:张薇