政府数据公开的巨大商业价值 | 中文互联网数据研究资讯中心
如果埋藏在档案馆中,数据永远只是一堆数据;而如果放在开放平台上,就有可能被深度挖掘,变成有用的信息。
“人类历史上最早的一批城市都诞生在河边,河流为人类提供了食物、水和交通。而我们要做的,就是创造一条数据的河流,来滋养信息经济的发展。”
多么浪漫而深刻!这句话是笔者在纽约一家网站首页上看到的标语。该网站致力于搭建一个数据交流、交换、分享的平台,既包括纽约市政府开放的各门类公共数据,也包括私人机构和企业公布的非公共数据。任何人都可以搜索、查看、下载、使用这些数据。尽管刚刚成立不久,但已经诞生了不少依托于它的应用。
出于对大数据发展趋势的敏感,笔者花时间进行了一些调研,发现类似于这样的网站在纽约已有近十家。而在此基础上,更有数以百计的进行数据分析和具体应用开发的网站和创新团队。
《开放数据法案》
2012年2月29日,纽约市通过了《开放数据法案》,3月7日由市长迈克尔-布隆伯格签署后正式生效,这是美国历史上首次将政府数据大规模开放纳入立法。
根据开放数据法案,到2018年,除了涉及安全和隐私的数据之外,纽约市政府及其分支机构所拥有的数据都必须实现对公众开放。而且规定,使用这些数据不需要经过任何注册、审批程序,数据的使用也不受限制。(一个有趣的题外话是:迈克尔-布隆伯格本人对数据也有着天生的敏感,他的成功经历也得益于数据,他是世界著名的财经资讯集团——彭博咨询公司的创始人。)
今年三月份是法案生效一周年纪念,也是法案第一阶段行动的截止日期——将各部门所有已对公众开放的数据纳入统一的网络入口,并且以便于使用、机器可读的形式在互联网上开放。到今年九月,市政府所辖的八十多个部门需要制定出各自的计划,以便完成2018最终目标。
纽约的行动具有重要意义,毕竟法律具有强制作用,比行政命令要稳定和长远;同时对其他地区也可以起到示范作用。位于美国西部的旧金山也开始了类似的开放数据工作,在硅谷浓郁创新氛围的支持下,在很短的时间里就诞生了大量基于政府开放数据的新应用。
近期,奥巴马政府也签署了开放数据法令。笔者认为,纽约的立法及其实践很有可能在将来成为政府开放数据的标准,供其他地区和国家参考、模仿。
开放数据平台
笔者最近登录纽约市的开放数据平台,发现已经有2090组数据上线。这其中既包括按邮政编码分区域的人口统计信息、用电量、犯罪记录、中小学教学评估等历史数据,也包括地铁公交系统的动态实时运行数据;既包括也包括小区噪音指标、停车位信息、住房租售、旅游景点汇总等与公众生活密切相关的数据,也包括饭店卫生检查、注册公司基本信息等与商业密切相关的数据。所有数据中,受到关注最多的是wifi热点位置数据,已被访问三万七千多次。
纽约市还通过各种形式鼓励公众查看和使用这些数据。对于开放数据平台上没有的数据,公众可以提建议表达需求,会有专门的工作人员对这些需求进行分析和答复。曾有一位应用开发者希望获得具体到小区层面的犯罪率数据,尽管这一数据目前还未在开放平台上开放,但工作人员仔细查阅后发现,可以在纽约警察局获得pdf格式的数据,并提供了链接。
开放数据平台能够提高社会运行的效率
在传统意义上,人们往往只把公共信息公开和提高政府透明度联系起来。但实际上,开放公共数据的意义远不止此。如果埋藏在档案馆的文件中,数据永远只能是一堆数据;而如果放在开放平台上,就有可能被深度挖掘,变成有用的信息。更多有效信息的传播通常能使社会运行更加高效。
和许多城市一样,纽约也被交通拥堵、社会治安、城市卫生等问题困扰。例如,社会治安曾一度是纽约市政府最为棘手的问题,每年要花费大笔的财政经费在警察和警务装备上。而随着详尽犯罪记录数据的开放,不仅开发出了提示公众避免进入犯罪高发区域和提高警惕的手机应用,从而降低犯罪发生的概率;而且还能将犯罪记录信息和动态交通数据结合起来,起到指导调配警力的作用。
公共交通系统的动态数据公布后,也随之出现了很多的学者和商业机构对其进行深度挖掘。不仅创造出了手机应用为公众出行提供实时建议,而且为地铁系统在客流高低峰时段、热点站和普通站之间的调配提出更优的方案。这些在原来警察局或交通部门各自垄断数据的情况下是不可想象的。
激发巨大商业价值
除了提高社会运行效率外,开放数据平台还蕴含着巨大的商业价值。关于空气质量和噪音的数据可以被用来估测房价,yelp、大众点评之类的饭店推荐网站上也可以同时纳入质监部门卫生检疫的测评。而这些又会反过来促进环境治理、激励饭店提高卫生标准。
另外,开放数据平台还能起到激发创新的作用。道理很简单,因为政府收集的数据大多是与公众日常生活直接密切相关的数据,往往最能激发人们的好奇心,也很具有挖掘价值。纽约的实践已经证明,开放数据平台会吸引大量高科技人才和企业的关注,激发前沿的创新和应用。虽然成立仅有一年,但围绕着纽约开放数据平台而产生的应用开发团队已有几百个。
一个可比的例子是gps(全球定位系统)的开放。1983年,美国将原本用于军事的卫星定位系统gps向公众开放使用,并且在2000后取消了对民用gps精度的限制。从汽车导航、精准农业耕作到物流、通讯等,gps开放后不仅服务了生产和生活,同时还创造了大量就业岗位。据估算,仅美国国内就有约三百万的就业岗位依赖于gps。
打开“智慧城市”的钥匙
“智慧城市”是一个最近几年被炒的很火的概念。但笔者认为,“政府推动+咨询公司”的模式不太可能成为建设未来智慧城市的主导力量。
建设智慧城市的本质是推动城市向更高层次的信息化发展,其最有效的推动力一定是无数的活跃个体。只有大量的个体才能实现对社会运行信息不断创造性、深度地挖掘和应用。公共部门要做的只是建设维护好一个开放数据平台。
纽约市已经初步建立起了一个基于城市社会运行数据的“生态系统”。这个生态系统虽然还很简单,但却是到目前为止对“智慧城市”最真实也最有推广前景的实践。
生态系统的最底部是传统经济及其参与者,包括个人、家庭、企业等,他们是城市数据的生产者。这些来自经济个体的数据通过两类机构被搜集和汇总——传统的数据收集者(如政府相关部门、电信运营商、金融机构)和新兴的数据收集者(比如像facebook这样的社交平台、google这样的搜索引擎等网络入口)。再上层则是智慧城市的核心力量——数据分析者和开发者,这里是智慧闪现的地方,包含有大量的创新开发团队和中小型科技公司。
&
(本文作者介绍:清华大学经济学博士研究生,现为哈佛大学访问学者。)
&