大数据的共享单车版图

大数据的共享单车版图

文|周宁奕

单车公司的各路消息变成贫瘠的融资圈最绚丽的新闻,不时刷着我的朋友圈,公司门口出了2个共享单车停放点,上班的路一夜间也被共享单车染成了红黄色。

变化来的太突然,后知后觉的我注册了几个单车app,才想到这是个很有意义的东西,比如你可以任意地跨城旅行,今天在上海张江上班,明天在西安古城骑车,当然,旅行锦上添花,占正常人10%的生活时间就到头了。这些车子更多是解决从地铁到办公室的15分钟路程,如果每天节约15分钟 * 2的时间,仔细算算一年能够拯救1个星期的无聊时间呢。

一个基本面

全上海单车有多少共享单车?好吧,show me the code,我爬了所有ofo和摩拜在上海的单车,去重后,理出超过27w辆摩拜单车,ofo则少很多,我觉得这基本是ofo单车没装GPS的问题(按常理,周围ofo的车更多),当然仔细想想,25w这个数字既不多也不贵,2000w常驻人口只有1%数量的摩拜单车,把全上海的单车按500块钱算也不一定换得汤臣一品的一套房子。

把上海的凌晨摩拜的所有单车画出来,一副星光闪耀的地图展现在面前:

大数据的共享单车版图

基本模型

根据长时间的数据监控发现,大部分人都只骑很短的路,12小时里走600米 – 700米的车是最多的(我计算了直线距离,真实距离估计1km多点),骑行5km以上的人非常聊聊, 因此大致上,单车是城市局部的微交通,所有单车根据短距出行的需求随波逐流。

大数据的共享单车版图

此时我的脑海里浮现出一个模型,半壶热水导入半壶冷水,最后总会变成均匀的温水,热水瓶就是单车的投放车,每辆车走的很短 ,但可能以每天1km的速度向外围扩散,日积月累的扩散效应应该还是很大的。单车的投放可能是不均匀的,但最终会趋于一种平衡。

当然,也有一些特例,比如黄浦江应该就是一个保温的热水瓶胆, 黄浦江在市区,桥、隧道、地铁都是不通自行车的,唯一可行的也许就是去码头坐船(不过特地去16铺码头看了看,还真有好多人带共享单车过江的),如果浦西投放了10w自行车,浦东没有,那长期来说浦东浦西的供需关系就是不等价的。早些时间,有公众号在网上po出这个自行车的对比分布图,浦东某单车投放和浦西形成了巨大的对比。

大数据的共享单车版图

黄浦江是屏障,铁路是屏障,更重要的是跨距离的卫星城,也许,摩拜单车作为新生事物,并没有成熟到可以刻画全上海的人口流动,因此我爬取了上海所有的公交线路和站点,以此刻画经年累月里,城市各个部分的连接关系,可以看出公交车的网络内部致密,连接稀疏,松江、金山、嘉定新城已经变成了离开市区的卫星城,在市区投放单车,自发去卫星城的人应该非常寥寥。

大数据的共享单车版图

哪里需要更多的共享单车

摩拜单车的一个报告说,人们的出行基本都围绕地铁展开。我以地铁站1km画圈,地铁一公里覆盖圈基本涵盖内环里的核心城市,确实因此,63%的摩拜单车都被圈到了里面: 大数据的共享单车版图

当然,这个结论还没啥用,只是说,地铁和单车关系很大。

好在俺手上还有一份地铁的数据,以某个星期一的数据为例,我统计了每个站点进出站的总和,很快我们能发现个基本面:

和房价分布比较一致,2号线也是上海交通的中流抵柱,尤其是虹桥火车站、北新泾、中山公园、南京西路、人民广场、陆家嘴,1号线老大哥,也很热闹,尤其是莘庄和徐家汇、人民广场和火车站,九号线的泗泾和九亭也不可小视,漕河泾的白领好多住在那。

大数据的共享单车版图

然后,我们统计每个地铁站500米内圈到的自行车的数量,咱们把进出站人数和自行车数量做个比例,那基本就算出供需关系了,下图,我们用点的大小代表地铁人流,颜色用来表示人均保有的自行车数量,又蓝又大的点,可能就是单车公司需要去优化自行车投放的,如南京西路、莘庄、徐泾、共富新村、泗泾、九亭这些站点。

大数据的共享单车版图

刚才的图,我们从地铁站为维度去区分流量,我想,还有一种途径,就是根据版块来看待投放的问题,我们假设习大大的“房子是用来住的,不是用来投资的”,忽略群租房一类的特殊情况,版块内的居住人口,大致等于这个版块包含的户数(有多少套房子)* 3,因此用链家的数据计算版块内总户数,基本可以代表每个版块夜间的常驻人口,只要我们配合凌晨的单车存量,基本可以刻画第二天一早的单车供需关系。

大数据的共享单车版图

你发现,三林、江桥、顾村、金山都是蓄积人口的大户,但是郊区面积也大,真正适合刻画人多人少的,还是按照户数 / 版块面积算人口密度比较合适,你发现环市中心是最密集的部分,包括了甘泉/宜川、光新、曲阳这些地方,如下

大数据的共享单车版图

因此,人均保有单车,更准确的说是每天早晨从家出发的路程的单车供需关系如下人均保有单车率 = 这个版块的单车数 / 这个片区的小区户数,我们会发现漕河泾、外滩、张江、五角场和金桥比率很大。

大数据的共享单车版图

当然,我们关注的不是哪里单车多而是哪里单车缺,显示深红色的表明,这个版块早上是缺乏共享单车的,当然,这个单车很缺的地方可能人也很少,我们以5万户为界限,删掉人口很少的版块,此刻我们发现,普陀区的甘泉/宜川版块、 闸北区的彭浦版块、奉贤区的南桥版块、浦东的周浦、浦江版块,这些都是比较缺共享单车的,这也许值得单车公司去优化布局。

大数据的共享单车版图

从这份数据里,我们还可以推测单车公司的投放策略,只要看今天系统中新捕获的单车分布,亮点代表在一个地方叠加了许多单车,这种分布,应是自然过程无法形成的。从昨天看,单车公司在流量最大的2号线的某几个站点附近投的单车。

大数据的共享单车版图

单车的数据非常之简单,经度纬度时间id,而且还不是连续的轨迹,但还是反应了一些问题。当然,我觉得共享单车最重要的不是今天我们讨论的怎么投放车子,而是变成一面数据的镜子,反射出社会的别的层面的问题留一个悬念到下一期吧。

End.

转载请注明来自36大数据(36dsj.com): 36大数据 » 大数据的共享单车版图

随意打赏

ofo共享单车数据共享单车数据报告共享单车 数据大数据 共享共享单车数据
提交建议
微信扫一扫,分享给好友吧。