如何避免投放被坑?运营数据甄别渠道作弊三种境界!
来源|量江湖
作者|以史为贱
最近在和一位CP朋友聊天的时候,他哭诉说在某家广告公司投放了20万做ASO,但是最后只给他们的APP带来了不到1500个的自然流量,作为新手是被坑大发了,老板已经怒了。
碰到这种情况,如何判断渠道的质量和狡猾程度,如何判断用户是否真实、是否来自墙、是否机刷or肉刷而来,是运营人员乃至整个公司最为头疼的事情,因为事关成本,而寒冬将至,成本则事关生死,不可谓不大。
用户的综合价值
那么我们如何识别真假用户,从而有效的管理渠道呢?从运营的角度,要是能根据上量的用户的综合价值来给渠道付费,那当然就是最佳策略。什么叫用户的综合价值,那就是该用户为公司创造出来的 综合价值,价值包括但不限于:
1,直接利润价值:比如购买行为,产生收入和潜在的利润;
2,内容价值:比如产生了积极的、优质内容,间接的创造价值等;
3,传播价值:比如因为ta的传播,引发了其他用户的使用等等;
4,衍生价值:停留时长或关注时长,所带来的广告收益等。
每个App的行业不同,这四种价值侧重不同。但是为什么我们App运营者这个甲方,从来就没有按照这个逻辑给渠道结算呢,而是按照下载激活这样最坑爹的方式进行议价结算,这又是另外一个问题,我们将另起文章讨论。
因为按照激活这个时间作为结算的时间节点对我们来说,这个时间窗口太短,对甄别用户的真假带来巨大的挑战。
在这个巨大的挑战面前,就分化出作弊防护的不同境界。
境界一:事后诸葛亮,事前猪一样
稍微量化一下这个境界,发现作弊的时间需要7天以上,能感知到40%左右的假量用户,其他超过半数的作假不能确保;通俗的讲,知道自己被骗了,但不知道骗了多少。他们的手段一般是这样的:
(一)看留存率
根据长期的斗争经验,他们发现渠道刷量会选择在次日、7日、30日这些重要时间点上导入用户数据。然后发现APP在次日、7日、30日这些关键时间点上的数据明显高于其他时间点。
而真实的用户的留存曲线是一条平滑的指数衰减曲线,如果他们发现留存曲线存在陡升陡降的异常波动,基本上就是渠道干预了数据。
(二)看用户终端信息
1,低价设备排名:根据经验分析渠道的新增用户或者启动用户的设备排名。如果发现某款低价设备排名异常靠前,他们就视其为异常,开始报警。
2,新版本操作系统的占比:经过渠道多年蹂躏,运营人员终于发现,很多渠道刷量工作室在操作系统版本的适配上会有延时。查看渠道用户的操作系统时,可以和全体手机网民的操作系统的分布做比较。
3, wifi 网络的使用情况:比如说2G、3G、4G的使用比例分布是否正常等等。
(三)看延伸信息
1,注册昵称的分布和规律,很多低端的刷假量的注册昵称有很强的规律性,各位运营看官肯定遇到这样的情况;
2,注册手机号码的归属地分布,这点相比各位看官也遇到过,某个渠道上来的用户手机号码不但来自某运营商的某个地市,甚至都是连号手机号码。
小结:该境界中的运营者严重依赖于个人经验,工具手段不专业化,操作效率低下,耗费人力物力,但发现问题时间滞后,而且稍微高级一点的作弊行为不能被发现。
境界二:亡羊补牢,损失在所难免
在这个段位的选手,甄别出真假的时间周期大概是2-7天之间,识别出来的假量大概在40%-70%之间,通俗的讲,他们可以比较确定性的识别出很大一部分假量用户,如果商务条件比较给力的话,是可以控制损失范围的。之所以有这样的效果是因为他们采用了一些专业的手段:
(一)单个指标
1,IP:是否为黑名单IP、是否为代理IP,跟一个巨大的黑名单库进行比对;
2,IMEI:是否为黑名单IP;
3,手机号码:号码是否非法,是否在黑名单。
(二)群体指标
1,IP:用户IP的地域分布是否符合先验数据的分布,地域包括国内的省份分布和海外市场的分布;
2,IMEI:用户IMEI号的地域分布是否符合先验数据的分布,IMEI所代表的制造商的分布是否随机;
3,OS:该渠道操作系统版本的分布情况是否符合一定的随机性和统计性,并与之前的先验数据进行对比判断;
4,机型:机型分布是否符合先验数据,以及最新智能手机出货量的比例;
5)位置信息:位置信息打开的比例,以及获取到位置信息的地域分布比例是否符合先验数据的分布,是否符合渠道承诺的地域情况,是否符合应用的实际分布情况;
6)运营商:运营商的数据分布是否随机,是否符合国内运营商的正常分布,以及海外运营商的随机分布;
7)网络接入方式:wifi、2G、3G、4G的分布比例是否与先验数据保持同样的趋势和数据特征。
(三)信息一致性
设备一致性的验证,包括:CPU、制造商、Mac地址、IMEI、机型、操作系统的一致性验证;
一般而言,通用的统计分析工具是实现不小上述的分布,这就需要用专业的作弊防护软件或安全软件来。如果CP朋友们有对自己的产品进行以上信息统计分析的需求,可以联系我们的防作弊专家进行咨询(微信号:admin24691)。
这个境界的运营者已经摆脱了手工处理,依赖个人经验的阶段,而是走上了算法和数据的专业化路线,但问题是每家的算法能力和数据积累参差不齐,因此在效果上各家能力差异很大,而渠道反过来猜测各个运营者的能力的强弱,来给他们掺不同比例的假量。
境界三:当下即断,零损失可以期待
在这个段位的选手,甄别用户的真假所需时间从15分钟到30分钟,如果是时间窗口延伸到24小时,那么他们的把握将更大。那么他们是如何做到的呢?总结一句话就是:软硬兼施,进攻是最好的防守!
(一)硬手段:
1,追踪其IP及端口的状态,以及IP的历史行为;
2,追踪其IMEI以及IMSI的对应关系,IMEI和IMSI基本可以理解为一把钥匙一把锁的对应,伪造一个IMEI号容易,但要想连同IMSI一同伪造,这个成本就变得奇高无比。而整个过程可以控制在15-30分钟,为跟渠道斗(si)争(bi)赢得充分时间窗口。
(二)软手段:
在第二境界的基础上,他们通过长期的数据积累和研究发现:各个指标反馈出来的信息强弱不同,因此对所有的指标进行赋值,并让这些指标对该群用户做作弊投票,当累计值超过阀值时,宣布该用户为可疑用户。这样就可以完成了在24小时内对用户真假的补充判断。
要达到这个水平,不仅需要长期大量的数据积累和与时俱进的更新,还要有强大的数据处理算法和软硬通吃的技术实力。