滴滴“猜你去哪”这款数据产品是如何实现的?
滴滴“猜你去哪”这个功能,是怎么实现的呢?这背后有哪些数据原理和数据逻辑呢?
数据产品经理老曹,自从入职了这家初级规模的互联网公司,给大家带来了很多惊喜和意外。不仅从业务角度给大家普及数据产品知识,传播数据文化。还能在平时的生活中,通过日常接触到的数据产品入手,讲解背后的原理和逻辑,让大家触类旁通,更深入的了解和掌握数据产品知识。
这不,数据产品经理小王在用滴滴打车的时候,就发现一个很有意思的功能:还没等自己输入目的地,滴滴居然猜出并提示了自己要去的地方。
这简直太神奇了,带着好奇心,小王赶紧跑到老曹身边,带着求知若渴的眼神,对老曹说:
“老曹,滴滴这个猜你去哪功能太有神奇啦,居然一下子就猜中了我要去哪里,而且还很方便,它是怎么实现的啊?快给我讲讲吧!”
老曹一听,这小伙越来越可以了,居然能在生活中发现细节,并有着强烈的好奇心,善于学会提问,心中还是很满意的:
“小王,既然你这么爱学习,那我就给你好好讲一讲。”
数据产品经理小王:
“好啊好啊,快来讲一讲,我小板凳都搬过来了!!!”
老曹又把自己旁边的那块画布拖了过来,涂涂改改又讲了起来:
首先,来说一下,滴滴猜你去哪这个产品为什么大家觉得好。
- 第一,它能减少用户输入,如果猜测准确,用户直接点击目的地就可以了,减少用户使用步骤;
- 第二,提升用户体验和粘性,足够准确的话,让人眼前一亮,印象深刻。
数据产品经理小王:
“这还用你说嘛,赶紧进入正题吧,它是怎么实现的啊!!!”
老曹笑一笑,娓娓道来:
好吧,那我们就进入正题,首先,让我们来看一下建设一款数据产品必经的四个步骤: 数据采集->数据清洗->策略算法->数据展现。
- 第一步,数据采集。主要是根据自己的业务场景需求,针对数据产品需要的数据内容,进行数据采集方案设计。数据来源可能是埋点数据上报,也可能是业务数据,还可以是爬虫获取的外部数据。
- 第二步,数据清洗。主要是针对采集的数据进行清洗,形成方便程序实现的数据字段和格式,并存储在数据表中。
- 第三步,策略算法。根据数据产品要实现的功能,选择算法策略模型,实现数据逻辑处理程序,并最终输出可以满足产品需求的数据或者结论。
- 第四步,数据展现。根据产品设计方案,完成最终的产品展示,可以用图表样式的方式展现,也可以直接展示结论或者建议。
数据产品经理小王:
大概了解步骤和方法了,老曹,能不能结合猜你去哪这个功能来讲一下每一步都是怎么实现的啊?
老曹在画板上抹去刚才写的东西,继续拆解起来:
结合滴滴猜你去哪,让我们看下第一步,数据采集。用户打开滴滴,它不像大众点评这种场景,用户不知道应该吃什么。绝大部分情况下,打开滴滴,都是明确有要去的目的地。我们需要做的只是将目的地猜对并提示出来。
所以需要两个核心数据:
- 第一个就是当前的时间、用户id、是否为工作日,当前地点的经纬度数据。
- 第二个就是用户的历史行程记录,因为用户去什么地方仅取决于用户及他所处的上下文,此处上下文包括位置,时间,历史行程等。
数据产品经理小王:
哇,那看来这些数据滴滴自己的系统里都有记录啊,大部分都是后台业务数据。
老曹点点头,接着说:
嗯,是的,这些数据其实都比较明确,很多都是后台系统数据。接着第二步,是数据清洗。根据算法策略需求,针对第一步采集的数据进行数据清洗,清洗出自己满足需求的数据格式。
根据第一步采集的数据,进行加工汇总,完成数据清洗工作,主要实现大概这样格式的数据形式,进行存储为算法策略提供输入。
实际产品涉及的数据和算法会更为复杂,此处仅从数据产品策划的角度拆解基础逻辑和数据,小王你主要是通过我的拆解意会下数据产品的实现方法。
数据产品经理小王:
嗯,我知道,我其实也是想通过案例看方法,掌握方法才是处理各种问题的根本,学会数据产品方法论,实现各种数据产品都不怕。
老曹不禁竖起了大拇指,点赞道:
再让我们来看下第三步,策略算法。模型选择上,可以使用高斯分布,从数据上来看,出发上下文和目的地之间,分布上应该是类似这样的一个钟形的样子。
然后,对每个用户的数据、以及每一个去过的候选目的地使用高斯分布来构建基于上下文的条件概率分布。并根据计算出的用户在特定场景上下文情况下去特定目的地的概率,选出最后可能去的地点作为’猜你去哪’的推荐结果。
数据产品经理小王听的越来越投入:
高斯分布,我记下来,我赶紧去了解下这个高大上的算法。
老曹一把把小王拽回来,赶紧说到:
别着急啊,我还有最后一步没介绍呢,就是数据展现环节,这里,主要分两个方面:
- 展现时机:在用户打开滴滴,还未输入数据目的地时展现。
- 展现样式:以tooltip的形式提示推荐目的地,可以点击选择。
经过这两个方面,最终就是你看到的在滴滴实现的猜你去哪这个数据产品功能啦!
数据产品经理小王两眼放光:
哇哇哇,厉害啦,原来这么多门道在里面,真是外行看产品表面,内行看实现路径,学习了,我要在以后的数据产品实现中,好好用这个实现方法和步骤,搞出更多厉害的数据产品来。
老曹想了想,补充说:
既然你提到了滴滴的猜你去哪这款数据产品,那有没有考虑过,滴滴背后还有哪些数据产品呢?
数据产品经理小王摸摸头,不好意思的低下头:
呃,我还真是想不到了。
老曹语重心长的对他说:
下次你可以再以点带面,继续观察下,其实,滴滴背后有很多数据产品的,例如系统派单、推荐上车点、排队时长预估、路径规划这些功能。
数据产品经理小王又来了兴趣:
那老曹也给我讲讲这些功能怎么实现的吧?
老曹一听,真想一口盐汽水喷死小王:
别忘了我今天通过滴滴猜你去哪介绍的数据产品实现四步法:数据采集->数据清洗->策略算法->数据展现,掌握这四步,你就可以自己来拆解下刚才说的这些数据产品功能啦!这个才是背后的核心和关键,好好消化下吧!
数据产品经理小王点点头:
嗯嗯,有道理,方法论我有,天下数据产品任我选!不说了,老曹,貌似该吃饭了,我们去吃饭吧,边吃边聊。
老曹仿佛也听到了肚子的抗议声,摸摸肚子:
那还不快走,给你讲个这么多,肚子都咕噜噜叫了,我真是在用爱心发电啊。
#专栏作家#
大鹏,公众号:一个数据人的自留地。人人都是产品经理专栏作家《数据产品经理修炼手册》作者。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议