【深度解密】 淘宝的虚假交易判定系统(派代网)

派代网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

 首先,由于某些人质疑发这文章的目的,在此重申,仅限于技术探讨,其他什么目的别找我,我也有我的工作,我也没时间。 视情况我会删除此文!


这个号称投资2个亿二代稽查系统是雅虎搜索引擎技术二次开发整合的。至于雅虎的技术,当时号称世界第一,其实不然,雅虎的不景气,直接影响到在研发这块的继续投资,以至于使他的技术停歇,而且面对谷歌的不断更新的Google Spider,雅虎因此早已也沦为非尖端前列了。

  

  下面先以技术方面说说这项系统组成部分:
其中包括基本的网络技术识别,识别包含的信息有:ip,网卡mac,浏览器和系统UI(包括了浏览器版本,系统版本和安装时间等等),硬盘序列号(实名认证和安装数字证书和安装支付宝安全控件调用),磁盘底层信息(支付宝支付安全控件EXE读取,其实就是读取硬盘ID)。客户端读取以上所有信息(旺旺客户端)

  订单交易轨迹自动学习分析系统:此系统首先收集交易收据,然后建立特征库给判定系统分析,这个包含多维度,据说有40多个纬度识别,其中1个或者以上纬度异常则自动进入判定程序,确认异常为系统疑似虚假交易降权,如多个纬度异常可判定确认虚假交易,关闭申诉入口!

至于这些纬度包含什么,是这个系统的商业机密所在,可以确认的是这是一个学习型的系统,每个类目的指标不一样,这些纬度都包含在我们日常购物的一些特征,举几个例子:

如旺旺在线聊天:如系统设定无聊天为w ,手机旺旺为WW,旺信为WWW,网页旺旺为WWWW 则不断分析交易数据得出一下比率:

正常女装类目100个订单中此纬度正常百分比:

WW>15%

www>0.15%

wwww>2%

类似此例子如购买旺旺信誉度

0=w 1心=ww 2心=www。。。。如此类推

纬度判定指标为

白旺旺 w<60%

ww<40%

www<30

评价数丶浏览数据指标,成交流量来源等等 你能想到的都可能被此学习系统作为一个判定纬度。
………..

  每个类目都有一个不同的判定指标值(比方说有些类目是大多自助购买的),任何一项指标超过此纬度(以上纬度为举例说明)可判定为交易异常,进入其他纬度判定,如判定纬度异常数值>3项(举例,每个类目和商家群体判定标准不一),则关闭申诉入口,否则提交到人工处理部门人工处理判定。

关于支付宝关联,支付宝系统在安全方面银行交易系统利用SSH框架做的https+数字证书,这个之记录硬件和加密数据传输,不存在账户关联,至少系统不会去检测,(进入人工判定难说)。比如说刷单返款,用其他支付宝返款之类的云云,无非是自我安慰而已。

再说一下物流单号,淘宝其实有两个物流公司接口,一个是客户端物流显示系统,就是我们看到的物流信息,还有一个是物流公司开放给淘宝的一个内部API接口,此物流信息和物流网点的系统显示的物流信息一致,比客户端的更及时,更详细。这个二代稽查系统虽然把物流系统作了一个纬度判定,但是因为在技术上的原因,并不能以匹配物流指标的字符串是否和收货地址相符合为系统自检测判定指标,因为这个对物流系统访问量太大,订单数据国语庞多,需要匹配的字符串太多,所以目前技术实现不了。但是重复的物流单号此系统可以分析判定,也是由于数据庞大,分析判定有一定的延期(有些订单一个月或者几个月后降权)后来淘宝针对更新了前端拦截技术,把重复的物流单号拦截在前台直接提示,但是由于数据库的更新延迟,也会有一定比例的拦截失败,所以至于物流,到了物流判定,一般是前面多项纬度除问题才到这项的。

订单申诉的都是随机抽取5个,大家不要纠结。

  以下分析一些降权案例:
1丶为什么很多人说刷一个新单品,很快就降权了,而刷的一个热卖单品,却不会降权。
原因:这就是热卖单品ID没有超过判定纬度的警戒值,没达到百分比,所以没进入判定。而新品交易订单量小,流量转化比一下子飙升,异常百分比一下就体现出来了。系统是宁可杀错以前,不放一个。因此,把他也不能确定的留给了你可申诉入口。
2丶为什么QQ群YY群刷,用了空包还是降权。
原因:今年更新的新技术因为对方登录的ID前面导致的多订单降权无法申诉(多原因),因此硬件信息被系统提名为重点检测,此PC和此旺旺ID生成的任意信息(包括COOKIE,客户端和控件获取的其他信息)都将优先进入判定分析,系统自动把此订单维度指标上升百分比。
3丶为什么正常交易的会被降权?
原因:还是系统分析后交易轨迹纬度异常,比如先低价卖再高价,这个就是此系统最新跟新的一个检测纬度,比方价格浮动> 70% 交易数据落差比为3 ,判定为异常,进入人工申诉接口。其他,大家去猜测,不一一说明。

  面对这个系统,如果你站在seoer的角度看问题,很多问题你会豁然开朗,为什么淘宝K你不K他?为什么K了还给你申诉?为什么淘宝收录他的比你快?为什么这个商品ID权重那么高?具有哪些共同特征?举个例子,其实我们分析直通车恶意点击过滤系统,就能分析出点击轨迹是否被淘宝系统过滤,分析他的搜索排序系统,就能分析出淘宝系统从大量订单中收集了哪些购物轨迹特征。。。大家深度挖掘,一定能挖出不少你之前没有考虑过的东西。

  此文先抛砖引玉,下次重点说说手机端的技术更新到什么程度。希望大家有所启发,看看能不能举一反三,实现无解模式,暂时性打败淘宝机器人!

随意打赏

提交建议
微信扫一扫,分享给好友吧。