DataStory丨亚信数据大数据云平台部方亮:面对雾霾,大数据能做什么?
一、空气质量有多重要
翻开近几年的年度关键词评选,你会发现“雾霾”始终牢牢占据在榜单之中。对于生活在城市中的人们来说,除了最基本的衣食住行的需求之外,恐怕最关心的莫过于健康。而雾霾,尽管很轻,但却是每个生活在城市之中的人们的不可承受之重。
有研究表明,轻度空气污染能影响一个人的心情,让人变得抑郁、烦燥,而重度空气污染能引发呼吸道及各种慢性疾病。中国工程院院士、呼吸科专家钟南山曾对媒体表示,呼吸科医生最怕灰霾天气,一到灰霾天,呼吸病人就增加15%以上。此外,有数据显示,PM2.5污染可致心脑系统及呼吸系统损伤,增加患癌风险并诱发早亡。2010年北京、上海因PM2.5污染致死者接近同期交通意外死亡人数的3倍。
我们从未如此在意“空气质量”这四个字。
二、当前空气质量服务远不能满足需求
然而,相对于人们对空气质量服务的迫切需求,当前的服务水平还远远不能满足需求。我们日常生活中常见的空气质量服务有:
1)手机天气App
这应该是普通用户接触天气信息的最常用入口,就算没有安装独立的App,系统自带的天气App也能满足用户基本的信息查询需求。
常见天气App
天气App的优势在于表达和呈现。由于手机屏幕大小的限制以及用户需求层次的不同,不同App在信息传递、视觉设计、内容组织等使用体验方面往往各有侧重。但相似点都是通过对细节的关注,与用户产生情感共鸣,往往并不以专业性取胜。
2)政府气象部门网站
作为官方渠道,其最大的优势是信息的全面专业。以中国气象数据网提供的数据服务为例,包括了地面资料、高空资料、数值预报、雷达资料、卫星资料等。除了能满足普通用户的信息查询需求,气象部门的公开数据对于开发者来说更具价值,他们或通过网络爬虫进行爬取,或利用气象部门开放的API进行调用,然后将数据封装到自己的应用和服务之中。
以往气象数据的价值往往被低估,与国外有上百类面向各行业的气象应用产品相比,国内的应用产品则只有一两类。鉴于此,在去年的云栖大会上,国家气象局宣布与阿里云达成合作,将向公众开放气象服务数据。希望通过此举能推动和广大的社会机构,更多的创业者合作,共同挖掘 气象大数据 的深层价值,开拓中国气象产业的空间。
中国气象数据网:数据服务
3)环境保护部空气质量通报
每年及每月初,环保部会定期通报全国重点区域和重点城市空气质量状况。包括:
按照《环境空气质量标准》(GB3095-2012)评价,公布所监测城市的整体空气质量状况,如全国338个地级及以上城市平均优良天数比例,轻度、中毒、重度及以上污染天数比例等。 按照环境空气质量综合指数评价,公布全国和京津冀、长三角、珠三角区域及直辖市、省会城市及计划单列市等74个城市空气质量状况,并列出空气质量十大的最差的城市和十大最好的城市。
通过城市间的横向比较和与往年指标的纵向比较,能反映出被监测城市整体的变化趋势,但这种综合的面上统计数据,无法让民众了解到每个具体城市——特别是他们最关心的自己所居住的城市——各种空气质量数据指标的详细变化情况,哪些有改善,哪些有倒退,以及这些变化到底整体代表了什么。
环境保护部:城市空气质量状况通报
三、问题的核心在于数据
空气质量服务的水平与人们的期望相距甚远。究其原因,数据量少是其掣肘:一方面是受限于政府气象部门的数据质量和精度,我国数据开放进程比较晚,且很多污染源数据都还不完善;另一方面则是因为气象数据需要与其他政府部门和企事业单位的数据进行多源融合,才能释放更大的社会经济价值。
1)空气质量数据
对空气质量数据来说,需要政府气象部门设置空气质量监测站点,比如北京市城区就有22个站点进行周边空气质量的监测。但,并非所有地区都有监测点。
北京空气质量检测站点
同时,城市范围内的空气质量也不是均匀的。建筑密度、路网流量、功能区规划,以及局部气象条件等多种因素都会对空气质量有影响,特别是地表空气,时常受建筑结构的影响导致空气循环不好,比如一个道路拥堵地区的汽车尾气无法及时疏散,那么这个地区的空气质量肯定和公园、湖泊等区域附近相比有很大差异。所以,一个城市内各地区的空气质量往往有差异,有时差异还很大。还是以北京为例,城区六环以内的空气质量约有40%左右的差别,AQI相差100以上,或者说相差两个等级。这就意味着,如果我们身边没有监测站点的话,我们就无法准确知道此时此地的空气质量如何。
因此,想要进行更细粒度的空气质量监测和预测,通常需要增加更多监测点。
2)多源数据融合
不过对于空气质量的预测,其实还可以利用大数据的手段,通过多源数据融合的方法来解决数据缺失和不精准的问题。
这就不光需要拥有有效站点的空气质量监测数据,还需要结合其他数据源,包括区域交通数据、人口流动数据、POI数据和道路网络数据等。将这些多源数据进行融合整理之后,可以基于已有的监测站点训练出相关模型。即使一个地方没有监测站点,但通过大数据的建模分析,同样能估计当地的空气质量。
除了对空气质量的预测,将气象数据应用到各行各业,更是需要与本行业甚至多个行业的数据相融合,才能形成有针对场景的个性化的气象产品和应用。
3)通过DataHub一键获取多源数据
如果是以往,寻找可用的数据是费时费力的事,更别提多源数据。但DataHub的出现让这一切都变得轻松简单。DataHub是国内第一个P2P数据流通平台,开放、透明、协议开源,可以一键实现数据获取、数据发布。数据流通在需求方、提供方之间进行,平台只负责认证、鉴权、计费,安全看得见。
平台链接了多源数据,比如上面提到的空气质量数据、交通数据、POI数据、人口流动数据,此外还链接了运营商数据、金融数据、征信数据等等。DataHub的愿景是让数据在阳光下流通,让天下没有难找的数据。
DataHub链接多源数据
四、我们需要怎样的空气质量服务
除了上面提到的空气质量预测的服务,空气质量数据还能做些什么?以时间的维度,大体而言有以下几个方向:
1)看过去:年度空气质量报告
针对环保部整体空气质量报告的细节缺失,和各空气质量应用只能报告当天或一周的空气质量的不足。可以抽取各城市全年365天的空气质量数据,形成年度空气质量报告,深入到每一个具体的城市,以可视化的方式从各个维度告知公众城市全年的空气质量状况。比如,全年AQI指数走势、各污染物对全年平均空气质量的影响比例、每一天各种污染物对空气质量的影响状况、全年各个空气质量级别的天数分布等。
例如:数字冰雹,2014中国空气质量盘点——让数据说话
2)看现在:实时细粒度空气质量分析
正如上文通过大数据手段进行空气质量预测所提到的,利用已有监测站点的实时和历史空气质量数据以及若干额外的数据源,可以对城市范围内无监测点地区的空气质量进行实时预测,分析空气污染物,确定空气污染的根源。以此为依据,我们反过来可以对政府在何处建设额外的空气质量监测站点给出策略建议,以最大化提升预测的准确性和稳定性。
例如:微软亚洲研究院,UrbanAir项目
3)看未来:空气质量预测&实时气象预警
空气质量服务的最大价值还是在于预测,作为全球最大的碳排放国,中国的空气质量预测市场尚处于初期,且正在高速增长,前景广阔。
假设我们能预测城市中每个局部区域的空气质量,比如家、公司、学校,那么我们就可以设置一个预警值,一旦提前预知空气质量超标,那么我们可以马上通知在学校的孩子、在公司的家人减少外出、早点回家,或是外出戴口罩,通知家里的父母关好门窗,并远程打开空气净化器。此外,我们还可以为那些喜欢户外锻炼的人设计合理的运动路线,从而保证沿途最优的空气质量。对于锻炼身体而言,相对于运动时间和距离,空气质量其实更为重要。而根据国外的经验,空气质量服务数据还可以广泛运用于农业、交通业、互联网、抗灾救险等领域。
例如:健身App,空气质量预警&路线优化
一个理想的空气质量服务,应该借助 物联网 与大数据,让每个人都能方便快捷地寻找到自己最需要的信息,并借助智能硬件之间的互联互通,形成闭环控制系统及更大范围的大数据。而这,需要各方共同努力。
作者:DataHub-亚信数据大数据云平台部 方亮
☞点击进入 亚信数据 在数据观的企业栏目>>>
责任编辑:王培