百度迁徙之后,大数据进入实用阶段
这几天,世界上最大规模的“动物迁徙”运动——中国春运达到最高潮。CCTV“据”说春节专题报道,利用百度迁徙、百度指数等大数据产品宏观、直观地呈现春运这一年度事件。想必大家对去年“百度迁徙”以烟花般绚丽的图层呈现春运大潮依然记忆犹新,今年百度迁徙升级到2.0版,增加了百度天眼、机场热度、车站热度等新的视角,这反映了春运的变迁,背后是大数据技术的升级。
新时代春运:“飞跃”时代到来
随着中国经济高速发展,承载春运的交通工具已从绿皮车升级为高铁、飞机、自驾多种方式,航空这种过去“高大上”的出行方式已成为普通人的选择。根据民航局预测,2015年春运期间,预计全国民航客运量将达到4752万人次,相比去年同期增长8%。
中国的“空中市场”还在不断普及。2014年英国《金融时报》报道,波音副总裁预测中国2033年将取代美国成为世界最大的航空市场,中国在未来20年里购买6000架客机,中国的机队规模将增至现在的3倍。与机队规模增长对应的是,飞行价格的大幅下降:国内机票几百元已常态化,甚至不少航线已低过对应的高铁。另外,机场接驳城市地铁的发达、燃油附加费的下调、机票购买渠道的便捷性都成为飞行这一出行方式普及的推动力。
在越来越多游子们选择“飞回家”的大背景之下,百度迁徙今年特别引入了飞行大数据:透过百度天眼可实时查看航班轨迹,天上有哪些飞机正在飞行、飞到了哪里都一目了然。点击对应飞机和航线还可查看飞机型号、机龄、起降时间、有无晚点等详细信息,甚至可以像机场塔台一样看到飞机经纬度、速度、海拔等数据。百度还借助LBS大数据提供机场热度展示,新闻报道可以根据这一数据了解全国机场人流密集程度,直观呈现春运现象。不论是百度天眼还是机场热度,都将冷冰冰地数字转化为直观的图像呈现在我们眼前。
大数据:多维度交叉运用更具价值
CCTV“据”说春节引入了百度迁徙、百度热力图、百度指数多个大数据产品,全方位详实地报道春节,涵盖春节期间人们的吃穿住行诸多方面。除了春运这个最受关注的迁徙运动之外,让我印象深刻还有一个“中国人对烟花爆竹的态度”报道。
CCTV通过可视化报表呈现了不同区域、不同城市的人们对烟花爆竹的态度,结论是一二三四五六线城市越到后面,对烟花爆竹关注度越高,这说明大城市对烟花爆竹管制更严格,同时也说明民俗在农村、四五六线城市保留更完善。这个可视化报表并不需要像过去那样通过“问卷调查”这么高成本获得,数据来自百度指数,百度指数则是根据用户搜索关键词、用户所处位置这些“大数据”挖掘得到。
如果大家留意到CCTV“据”说春节栏目,对于大数据与我们生活的结合正在日趋紧密相比更有认同感。它可以了解人流整体迁徙特征、不同地段人流分布情况、不同城市人们在关注什么、不同年龄段人们在春节的兴趣,等等。而能够做到这些,就必须要掌握海量用户各种维度的数据。实际上,拥有大数据的企业并不少,比如地图玩家都有LBS数据、腾讯有用户聊天数据、航班管家这类App拥有航线数据、12306则有铁路出行相关数据,但这些玩家要么数据比较单一,要么不具备挖掘的能力。
百度之所以在大数据上能够走得最快,成为CCTV等权威媒体报道的数据来源,核心在于两点:百度拥有多维度的交叉大数据:LBS、搜索、团购等等,并且具备把这些数据关联交叉并进一步挖掘的技术。百度迁徙、百度热力图、百度预测这些产品背后其实都是数据和技术在支撑。
大数据正在从“绚丽”到“实用”阶段
如果看回几年前的“云计算”,不少人都觉得这是噱头、是概念,但现在云存储、云视频、云计算都已成为主流应用。在我印象中,大数据在去年都还被不少人认为是噱头,不过现在它同样已进入了“不再是噱头而是常态”的阶段,人们正在适应大数据与生活的紧密结合。从“百度迁徙”的升级便可对大数据的发展见微知著。
百度迁徙去年推出后,不少人都赞叹:华丽、牛X、炫酷。可以对于它具体能够做什么,还是摸不着头脑。百度官方解释是,它可以直观宏观地呈现人口迁徙情况,对于新闻报道、社科研究、全民科普等具有巨大价值,同时还可以辅助政府和企业更有效地决策,比如规划线路等等。不过这些对于用户而言感受并不直观。今年百度迁徙一个变化就是更加关注,它可以给普通用户带来什么价值。
百度天眼整合航班信息,以可视化方式呈现不说,还可以查询航班起降状态、关注某个航班等翔实信息,在保证产品够酷的同时具备实用性,等于说它做了航班管家在做的事情。常坐飞机的人一定会安装航班管家或者航旅纵横,足以说明航班信息对于航空旅行者的价值。百度车站和机场热力图对于用户规划出行、接送亲友,都有参考价值。百度天眼呈现的实际是整个大数据从“噱头”到“实用”这个变化。
2014年,百度成立专门的大数据实验室,在大数据上动作频频,产品化、大众化、开放化是几个明显的方向。一是预测业务,陆陆续续推出世界杯预测、票房预测、景点预测、高考预测诸多预测业务,并整合预测能力为百度大数据预测评测;二是LBS大数据,百度迁徙一炮走红后,又陆续推出百度热力图、百度天眼等产品,其中热力图可以呈现商圈、景区的人口密度。三是整合能力到大数据引擎推出,让前文提及的具备大数据但无挖掘能力的大中型企业和政府机构可以挖掘手里的数据。大数据成果背后是NLP(自然语言处理)、精准定位技术、大数据模型、深度学习以及GPU机器集群等底层技术在支撑。
显而易见,百度大数据已经从实验室走出来,变成产品、融入产品,走向大众,同时开放给行业。大数据对于百度而言,并不是噱头和炒作。已经成为其核心业务。整个行业对于大数据,也已从“看不懂不理不问、不看清跟风炒作”进入到“试着看跟进学习”这个阶段。我们已经置身大数据世界,被大数据所影响,不论是你是否感知是否承认,你都在为大数据世界贡献着数据和样本,并受益于此。
微博@互联网阿超 微信 罗超 (luochaotmt),扫码来关注: