如何避免投放被坑？运营数据甄别渠道作弊三种境界！

百度百家 • 8年前扫码分享

我是创始人李岩：很抱歉！给自己产品做个广告，点击进来看看。

来源|量江湖

作者|以史为贱

最近在和一位CP朋友聊天的时候,他哭诉说在某家广告公司投放了20万做ASO,但是最后只给他们的APP带来了不到1500个的自然流量,作为新手是被坑大发了,老板已经怒了。

碰到这种情况,如何判断渠道的质量和狡猾程度,如何判断用户是否真实、是否来自墙、是否机刷or肉刷而来,是运营人员乃至整个公司最为头疼的事情,因为事关成本,而寒冬将至,成本则事关生死,不可谓不大。

用户的综合价值

那么我们如何识别真假用户,从而有效的管理渠道呢?从运营的角度,要是能根据上量的用户的综合价值来给渠道付费,那当然就是最佳策略。什么叫用户的综合价值,那就是该用户为公司创造出来的 综合价值,价值包括但不限于:

1,直接利润价值:比如购买行为,产生收入和潜在的利润;

2,内容价值:比如产生了积极的、优质内容,间接的创造价值等;

3,传播价值:比如因为ta的传播,引发了其他用户的使用等等;

4,衍生价值:停留时长或关注时长,所带来的广告收益等。

每个App的行业不同,这四种价值侧重不同。但是为什么我们App运营者这个甲方,从来就没有按照这个逻辑给渠道结算呢,而是按照下载激活这样最坑爹的方式进行议价结算,这又是另外一个问题,我们将另起文章讨论。

因为按照激活这个时间作为结算的时间节点对我们来说,这个时间窗口太短,对甄别用户的真假带来巨大的挑战。

在这个巨大的挑战面前,就分化出作弊防护的不同境界。

境界一:事后诸葛亮,事前猪一样

稍微量化一下这个境界,发现作弊的时间需要7天以上,能感知到40%左右的假量用户,其他超过半数的作假不能确保;通俗的讲,知道自己被骗了,但不知道骗了多少。他们的手段一般是这样的:

(一)看留存率

根据长期的斗争经验,他们发现渠道刷量会选择在次日、7日、30日这些重要时间点上导入用户数据。然后发现APP在次日、7日、30日这些关键时间点上的数据明显高于其他时间点。

而真实的用户的留存曲线是一条平滑的指数衰减曲线,如果他们发现留存曲线存在陡升陡降的异常波动,基本上就是渠道干预了数据。

(二)看用户终端信息

1,低价设备排名:根据经验分析渠道的新增用户或者启动用户的设备排名。如果发现某款低价设备排名异常靠前,他们就视其为异常,开始报警。

2,新版本操作系统的占比:经过渠道多年蹂躏,运营人员终于发现,很多渠道刷量工作室在操作系统版本的适配上会有延时。查看渠道用户的操作系统时,可以和全体手机网民的操作系统的分布做比较。

3, wifi 网络的使用情况:比如说2G、3G、4G的使用比例分布是否正常等等。

(三)看延伸信息

1,注册昵称的分布和规律,很多低端的刷假量的注册昵称有很强的规律性,各位运营看官肯定遇到这样的情况;

2,注册手机号码的归属地分布,这点相比各位看官也遇到过,某个渠道上来的用户手机号码不但来自某运营商的某个地市,甚至都是连号手机号码。

小结:该境界中的运营者严重依赖于个人经验,工具手段不专业化,操作效率低下,耗费人力物力,但发现问题时间滞后,而且稍微高级一点的作弊行为不能被发现。

境界二:亡羊补牢,损失在所难免

在这个段位的选手,甄别出真假的时间周期大概是2-7天之间,识别出来的假量大概在40%-70%之间,通俗的讲,他们可以比较确定性的识别出很大一部分假量用户,如果商务条件比较给力的话,是可以控制损失范围的。之所以有这样的效果是因为他们采用了一些专业的手段:

(一)单个指标

1,IP:是否为黑名单IP、是否为代理IP,跟一个巨大的黑名单库进行比对;

2,IMEI:是否为黑名单IP;

3,手机号码:号码是否非法,是否在黑名单。

(二)群体指标

1,IP:用户IP的地域分布是否符合先验数据的分布,地域包括国内的省份分布和海外市场的分布;

2,IMEI:用户IMEI号的地域分布是否符合先验数据的分布,IMEI所代表的制造商的分布是否随机;

3,OS:该渠道操作系统版本的分布情况是否符合一定的随机性和统计性,并与之前的先验数据进行对比判断;

4,机型:机型分布是否符合先验数据,以及最新智能手机出货量的比例;

5)位置信息:位置信息打开的比例,以及获取到位置信息的地域分布比例是否符合先验数据的分布,是否符合渠道承诺的地域情况,是否符合应用的实际分布情况;

6)运营商:运营商的数据分布是否随机,是否符合国内运营商的正常分布,以及海外运营商的随机分布;

7)网络接入方式:wifi、2G、3G、4G的分布比例是否与先验数据保持同样的趋势和数据特征。

(三)信息一致性

设备一致性的验证,包括:CPU、制造商、Mac地址、IMEI、机型、操作系统的一致性验证;

一般而言,通用的统计分析工具是实现不小上述的分布,这就需要用专业的作弊防护软件或安全软件来。如果CP朋友们有对自己的产品进行以上信息统计分析的需求,可以联系我们的防作弊专家进行咨询(微信号:admin24691)。

这个境界的运营者已经摆脱了手工处理,依赖个人经验的阶段,而是走上了算法和数据的专业化路线,但问题是每家的算法能力和数据积累参差不齐,因此在效果上各家能力差异很大,而渠道反过来猜测各个运营者的能力的强弱,来给他们掺不同比例的假量。

境界三:当下即断,零损失可以期待

在这个段位的选手,甄别用户的真假所需时间从15分钟到30分钟,如果是时间窗口延伸到24小时,那么他们的把握将更大。那么他们是如何做到的呢?总结一句话就是:软硬兼施,进攻是最好的防守!

(一)硬手段:

1,追踪其IP及端口的状态,以及IP的历史行为;

2,追踪其IMEI以及IMSI的对应关系,IMEI和IMSI基本可以理解为一把钥匙一把锁的对应,伪造一个IMEI号容易,但要想连同IMSI一同伪造,这个成本就变得奇高无比。而整个过程可以控制在15-30分钟,为跟渠道斗(si)争(bi)赢得充分时间窗口。

(二)软手段:

在第二境界的基础上,他们通过长期的数据积累和研究发现:各个指标反馈出来的信息强弱不同,因此对所有的指标进行赋值,并让这些指标对该群用户做作弊投票,当累计值超过阀值时,宣布该用户为可疑用户。这样就可以完成了在24小时内对用户真假的补充判断。

要达到这个水平,不仅需要长期大量的数据积累和与时俱进的更新,还要有强大的数据处理算法和软硬通吃的技术实力。