产品经理的数据清洗技巧 你一定要掌握!

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
想要建立一个数据分析模型,就必须进行数据的清洗,这样才能得到高质量的数据,然后做一些深度的挖掘。今天给大家分享产品经理的数据清洗技巧,你一定要掌握!
产品经理的数据清洗技巧 你一定要掌握! 我们要从以下几个方面来解决数据的质量问题:

一、建立数据完整性

比如在熟悉的用户中缺少性别,设备型号,年龄。

设置方法:什么东西缺补什么

例如用推算的基本信息补全,如身份证就能推算出一个人的性别、年龄、籍贯,实在补不了的,资料就被删除了,不要产生冗余。

二、建立数据的唯一性

例如,相同的新用户注册从APP、web、微信公众号H5,决定用户是一个人还是每个端都有一个。

设置方法:去除重复,只保留一次

在Excel或sql语句中使用代码进行重写,如果数据复杂,则可以编写系列规则来过滤重复的用户。

例如app客户端用手机注册,关注话题的女性新用户,以及PC端用微信注册用来关注话题的女性用户,都可以通过手机号进行重置。

三、建立数据的权威性

例如注册app的新用户是女性,H5的注册通过微信授权的是男性。新用户性别以微信授权为准。或提示用户已登记,是否更改性别。

设置方法:使用最佳渠道或权威人士的指示器。从来源上看认可度最高,符合实际情况的指标。

四、建立数据的合法性

更多的是数据常识性的数据工作,例如,成人的体重不能只有3公斤,身高不能超过3米等等。

设置方法:为数据设置逻辑规则提醒

超出规则范围时发出警告,例如输入密码的长度,超出了设定的范围。

五、建立数据的一致性

这个实际上是很困难的,在产品迭代过程中,数据指标还需要迭代维护。例如前期的主页点击,可以变成主页上一些功能入口的点击。

但是数据级别的指标都叫:首页点击。

构建数据指标体系,通过对新指标的不断维护和完善来完成解读工作。

数据需求源于部门整合,将多个数据需求汇总,满足多到点再点对点的数据流转。

看起来内容很多,其实还是比较简单的,掌握一些基本的数据清洗技巧,这样就能轻松得到高质量的数据,然后才能进行数据分析。这些技巧你都掌握了吗?一定要认真学习哦!

以上就是“产品经理的数据清洗技巧 你一定要掌握!”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。

随意打赏

提交建议
微信扫一扫,分享给好友吧。