技术解读DMP:个性化推荐的基础,移动互联网最宝贵的数据资源
文/何鸿凌 ,中国移动集团公司业务支撑系统部,从事大数据平台规划工作,微博@ BigData分析
周涛博士曾经与人合著过一本书《 个性化:商业的未来 》,描述了大数据时代中商业的变化,这些变化我们已经逐步感受到。不管你是不是新注册的用户,你登录电商网站或者打开电商的APPs后看到的信息是个性化的;所看到的互联网广告是个性化的;收到的优惠券也是个性化的。
在层出不穷的商业个性化背后是个性化引擎,而其中的关键则是 DMP (数据管理平台)。因为个性化推荐的“比较优势”主要体现在,作为个性化推荐依据的“数据”,而不是算法和技术。DMP正是利用大数据技术从海量杂乱的数据中抽取出有价值信息的重要基础设施!
DMP的概念由互联网广告界发扬光大。在那个世界里面,DMP通过JS插码和Cookie获取了大量的用户访问信息,然后将其加工成为用户关注类和购买类标签,提供给DSP或者ADX用于RTB竞价。
是DMP的发展促使广告的程序化投放向RTB演进,艾瑞咨询的报告显示2013年美国RTB展示广告已占数字展示广告的19%。TURN、bluekai、品友、易传媒是广告行业中DMP的佼佼者。不过随着APP逐渐占据了流量的主流,原有通过JS和Cookie获取数据的DMP模式需要改变。
从本质上来说,广告的RTB是个性化推荐的一种,推荐的依据是历史浏览行为,推荐的东西是广告。个性化推荐的应用范围很广,比如在“ 今日头条 ”、“ 网易新闻 ”APP上对新闻的推荐;京东、一号店上对物品的推荐;起点、手机阅读上对图书的推荐;社交网络上对好友的推荐;应用市场上对应用的推荐......在这些个性化推荐的背后,都离不开DMP或者功能类似的平台。
个性化推荐回答了依据什么样的数据,在什么场景下给访问者推荐什么东西的三元组问题,其中DMP承担提供依据的职责。对DMP来说,最关键的有两点: 1)如何收集和处理作为判断依据的数据;2)如何建立一种ID体系来使得收集的数据和使用方的数据能够对应起来。在互联网广告中上述两个关键点分别是浏览记录和Cookie ID 。
在大数据时代,任何拥有数据的企业和实体,都可以依据DMP的模式,将数据整理为决策依据提供给有需要的企业和实体,由此实现数据变现。这种方式可以自动化实现、可以有效评估数据的作用,是当前最靠谱的数据货币化方式。
比如 百分点 ,利用从电商网站、社交媒体、第三方收集来的数据,形成用户关注和购买标签,通过DMP的形式提供给电商或其他所需的企业进行个性化推荐。这个时候数据的使用方相当于互联网广告产业链中的DSP。百分点的ID体系通过cookie或者IMEI来实现。
又比如TalkingData的 Mobile DMP 利用了自己在全球8亿用户的APP中的插件收集的数据,以及与各应用市场等第三方合作的数据来分析用户的行为、兴趣、爱好,形成用户精准画像通过API的形式对APP开发者提供。APP开发者完成类似DSP的功能,可以自己组织推荐的内容,包括广告、数字内容和物品等。TalkingData利用自己的ID体系(TDID)来实现关联。
拥有数据才能做DMP,因此几大互联网巨头当然最具备做DMP的资格了。腾讯利用QQ、微信等众多应用中收集的数据分析用户的行为,然后通过广点通实现个性化广告的推荐,似乎还没有听说腾讯准备单独将DMP的能力对外提供的举动。
相比起来Facebook已经这样做了,如果用户在其他应用或者网站使用Facebook的ID登录的话,Facebook就可以将自己的DMP提供给对方,供其完成个性化推荐。
阿里巴巴也在尝试将积累的用户标签通过 阿里妈妈 的广告交易平台TANX提供出去,现在还没有说要收费,但也许以后会有商业化的运作,毕竟跟没有这些数据相比,DSP们更值得RTB了。
百度也具备这样的能力,因为搜索关键词和随后的点击是最能直达使用者内心世界的数据,可能因为百度的ID体系较弱吧,尚未听说百度有计划将其打造为DMP的方式帮助其他APP和网站做个性化推荐。
移动互联网改变了一些东西,比如Cookie的逐步消失,因此那些从网站或APP内部收集数据的企业有能力颠覆以前通过cookie收集用户行为的DMP,因为他们有独一无二的用户行为数据。但是慢着,云——管——端,用户数据流经的各个环节也许都有潜在的DMP生意可以做!
大致上讲阿里、腾讯、百分点(电商对接数据部分)可以算是云范畴做DMP的,百分点(JS获取数据部分)和TalkingData的SDK插件数据算是端范畴做DMP的,那么这样分析来,应该还有两类重要的可以做DMP生意的企业。
一是终端厂家。比如小米、苹果等,实际我了解到小米正在基于终端上采集的用户信息做自己的DMP,或许年底就能商用,ID体系或许就是IMEI等终端ID。二就是运营商,集奥聚合、亚信等公司依托和运营商的良好合作关系通过网络侧进行DPI的方式获取用户上网行为数据,并将其打造为DMP能力对外输出。
大数据时代已经拥有数据的企业是幸福的,但是还是有一些公司,利用自己的技术和算法征服了垂直电商,在提供DMP服务的时候同时获取数据,由此而进入了良性循环,不断增加的数据量和维度引发了网络效应,使得数据的价值按照N的平方的曲线增加。
就像一个巨大的飞轮,也许开始推动它的时候比较吃力,但是等它动起来以后,就可以轻松地让它持续运转。DMP们如何找到自己的飞轮,是其爆发的关键所在。
[本文来自读者的投稿,不代表 36氪 立场]
AD: 云之家 ,一种新的工作方式。