大数据时代 基于用户画像的精准营销
[导读]8月5日,清华大数据思享会营销大数据系列之“精准营销如何更精准”在清数D-LAB成功举办。本次思享会我们邀请了国美在线CTO于斌平进行了以“基于用户画像的精准营销”为主题的精彩分享,并结合他自己在国美在线精准营销体系的构建经验介绍了国美在线的实际应用案例。我们还邀请了商助科技(99click)资深专家顾问郑泉分享了“让精准广告更精准”主题,并结合自己为品牌企业提供数据监测与效果评估的多年实践经验介绍了品牌企业广告投放KPI指标选取。同时,参与本次思享会交流探讨的还有来自金融领域、交通物流领域、教育文化领域、房地产领域、奢侈品领域、广告领域等三十余人。以下是国美在线CTO于斌平关于“基于用户画像的精准营销”主题分享的主要内容。
1、关于 大数据 的理解
作为一个互联网的技术从业者,之前从事过多年的传统数据仓库方面的工作。随着技术的进步,互联网时代的大数据解决了原来未解决好的很多问题,主要表现在两个方面:第一是技术上的进步使得大数据的成本大大缩减,降低了使用门槛。原来主要依赖Oracle等数据仓库,以二维表为基本元素,动辄使用大的存储设备和小型机,而现在做大数据主要是使用HDFS等分布式系统及内存技术替代传统的IOE。但 数据分析 的思路和原理跟原来是一样的,得到原始数据后,进行数据清洗,再依据目标进行数据建模,建立各种数据集市,最后以报表的形式呈现结果。第二是数据的容量、速度、多样性及价值(即 所谓的“4V”)不一样了。尤其是具备了多样性,原来主要是结构化的数据,现在则可以有非结构化的数据,如日志、用户行为,甚至图片、声音文件等,这些非结构化的数据可以很快地与结构化的数据相关联,快速分析出结果,极大地解放了人们的思想,所有发生的故事都可以用大数据来关联分析,极大解放了数据,给数据很大的价值。
2、用户画像体系
精准营销应用具体包括以下几个方面:
一是个性化搜索,通过国美在线平台搜索“手机”,不同的人搜出的结果是不一样的,因为不同的人喜好是不同的,比如有人使用的是苹果,有人使用的是三星,也有的人使用的是小米或者其它手机,系统会基于用户的行为来猜测用户想搜什么。传统的搜索,若要搜手机就只出现手机,然后加上一个业务权重,如果最近要推广苹果手机,就会把苹果的权重往上加,搜出来的结果就主要是苹果手机。个性化推荐搜索不仅直接推荐用户想要的,也会推荐猜测用户想要的结果,这就是搜索推荐,相当于一个店小二或者门店促销员的角色。
二是社交传播,以微信广告为例,微信广告不是所有的广告向所有人推送。微信台会有一个分析系统,它分析出有些人经常看汽车,就会给这些人推汽车广告,有些人经常浏览衣服,就会给这些人推衣服广告。所以看到自己收到的广告,周围人不一定都收到,这就是基于用户画像来推荐的广告。
三是热力图工具。热图工具是内部使用的基于大数据结果分析的工具,主要是显示哪些地区热度高、哪些品类用户比较关注等实时状态的工具。
四是会员营销。传统意义上理解的会员营销主要是发送短信、发送邮件、发放宣传单等方式,这些其实都是会员营销的一个结果应用,其实前面讲到的几点也是基于大量数据分析的会员营销。
五是智能选品。当打开国美在线网站或者登陆手机App时,一个页面或者一个手机登录页上面,哪些东西呈现在前面,哪些东西呈现在后面,这就是智能选品,也是根据用户画像来做的,甚至包括采购的定价也是智能定价。
六是DSP广告。DSP广告就是需求方的广告平台,简单的讲就是用户主动看过什么就会给用户推相应的广告。比如,某用户在国美在线看了一个杯子,接下来你去浏览新浪、搜狐、微博等门户网站时,就会看到杯子的广告。
七是个性化推荐。现在网站到处都有推荐,个性化推荐跟这些差不多,不太一样的地方在于它是实时的。电商行业的转化率平均值是3%。国美在线的个性化推荐转化率达到17%-18%,有时候能达到20%,已经算是很高。转化率高反映的是推荐比较准确,核心就是用户画像比较准确。
精准营销的核心是用户画像,而用户画像的核心是标签。那么,标签是什么呢?具体来讲,某些用户喜欢健身,那就给他打个标签“喜欢健身、阳光”;或者某些用户穿的衣服是修身型的,就可以给他打个标签“修身”,这就是标签。若系统得出了这个结论,那么等他下次来的时候,系统就会为他推这类产品,比如健身器材、修身的衣服这类产品。
标签怎么来呢?来自大量用户的基本数据。比如在网上浏览的行为数据,包括用户在门户网站甚至其他电商网站上浏览的数据。主要包括用户数据、行为数据、消费数据、商品数据、行为数据和客服数据等,任何跟用户有关系的数据都可以作为数据源。数据源这部分可能会涉及到“数据交换”,即从其他网站等渠道通过一定方法拿到需要的数据。然后是数据管理平台,管理平台的核心是做标签的管理,包括定义、编辑、审核、查询等等,及对应的分析工具。在此基础上再来建立各种模型,包括用户购买力模型、群体画像模型、购买兴趣模型、促销敏感度模型等。通过系列模型得出的结果就是用户的标签,包括用户DNA、品类偏好、品牌偏好、促销偏好、价格偏好等。截止去年底,国美在线大概有600多个不同门类的标签,包含季节、价格档次等。
3、用户标签体系
用户画像的核心是标签,标签可以分为以下几类:
第一类是基础属性,比如“所在城市”、“会员等级”、“生命周期”、“会员网龄”等基本信息,其中生命周期是按照曾经访问的频次,把用户区分为活跃的会员、沉睡的会员或者沉闷的会员,或者网上叫死粉、僵尸粉等。
第二类是消费能力,购买力、消费等级、累计消费金额、消费频率等。
第三类是行为偏好,时段、访问方式、品类偏好、品牌偏好等。访问的方式、时段数据的分析可以用于决定采用哪一种方式给用户推广告,例如,有些人喜欢晚上访问网站,或者喜欢看视频,那我们通过跟视频网站合作,在视频中的广告对这些用户进行推荐。
第四类是购物偏好,购物时段、偏好品牌等。
第五类是客户服务,用户评价等级、退换货次数(金额)等,这里包括两层含义,有些人经常退货或者拒收,有些人买一件东西时会下两个单,货到后挑一挑,收一个退一个,对于这两类用户的成本是非常大的,通过分析定位这类用户。电商行业还有一个概念叫“占单”,比如说iphone7马上要推出,有可能几千个库存刚放出来几分钟就没有了,其中有些是被正常用户买了,有些可能是被竞争对手战术性的占住了,还有些是用机器下单给恶意占住了。正常一个订单,需要24小时之内支付的,超过24小时不支付,订单就取消。如果分析出的这一类用户,就可以给他们限定10个小时或者半个小时甚至10分钟不支付就取消订单。
第六类是业务场景,用户DNA和用户特权等标签。前面提到的订单取消是用户特权的一个特例,负向的特权。对于分析出正向标签的,贡献额比较大的用户,比如国美在线用户等级从G1到G5,一个G5用户,有可能就给免邮或者会员生日礼物等特权。
4、规则与模型
标签是基于规则和模型出来的,而基本的规则是根据时段偏好、站点偏好、访问偏好(用手机APP,还是用微信,还是用PC)、消费周期,然后基于基本的生成购买力算法、用户群体画像算法、促销敏感度算法等生成标签。这些出来的标签会不断地形成一个标签体系,同时,加上一些业务、营销的因素,或者加一些其他的权重来人工干预更新标签,从而建立起基于数据规则和算法模型的标签。
另一种方法就是通过用户采样进行标签扩散,对于经常去浏览、购买的老用户,通过大量采集用户数据进行分析,然后是标签抽取和用户行为建模及以生成标签规则。对第一次登录国美在线或者就来过一次的用户,可以推荐什么商品呢?这时就需要统计学中的采样来进行标签扩散,就是拿出了其中某一类用户或者某几个用户的行为标签,作为这一类人的公共行为标签。所以大家会发现,第一次登录或者只登陆过一次的用户,最终推荐的商品,可能有些跟这个用户的上次浏览相关,有些就不相关,其中不相关的这类推荐,就是基于采样把用户归到一类里面,据此来做的推荐。
5、推荐
国美在线上“猜你喜欢”个性化应用,包括网站的底部、列表页、搜索页还有首页等页面位置。首页是在正中的位置,转化率非常高,另外不同的人登录APP,每个人获得的推荐商品都不一样的。
在国美在线APP“用户中心”的界面,通过用户的购物行为,推出用户DNA的页面,会给用户打上基本的标签,例如喜欢什么类型的商品,经常“海淘”的用户可能就有“海淘达人”的标签,这样建立了每个用户的购物圈画像和商品专属推荐。
还可以基于气候与天气进行推荐,例如深圳,天气比较热时,页面上会推荐“空调”等类似的消暑商品;若出现“雾霾”天气时,则会推荐“空气净化器”。这类规则不复杂,而且天气数据都是公开可以拿到的,只要在原来的基础是增加一些标签。
关于视觉的推荐,也就是基于图片的搜索,目前使用的还比较少。当用户输入一张图片,结果会根据这个图片给出相关的推荐。比如逛街的时候,看到别人穿的衣服或者拿的东西不错,可以直接拍下照片,通过相应的图片计算和搜索算法,相关的商品就可以搜索出来。
前面介绍了推荐系统的应用,那推荐系统的技术架构是怎样的呢?大数据平台的底层是各种数据平台,数据源包括会员数据、商品数据、订单数据等结构化的数据,以及行为日志等是非结构化的数据,包括浏览日志、点击日志、客户和客服的对话记录等。数据源上面是数据同步,通过“Sqoop”、“Flume”、“Kafka”等技术来实现,它的特点是存储的数据和交换的数据比较多。然后是数据存储,用的比较多的是“MySQL”、“Hbase”等。接着是计算框架,如“MapReduce”、“gome_realtime”、“spark”和“sparkstreaming”等。再接着数据平台之上就是算法引擎和推荐引擎,通过许多的算法模型,如“协同过滤”、“关联规则”、“矩形分解”,形成用户画像,结果可以是数据形式,报表形式、或者Excel表形式等。最后是各种应用端,“网站”、“APP”、“WEB”或其他营销应用端。
6、广告
DSP广告系统连接广告主和用户两端,以前的广告是购买广告位,现在基于DSP广告系统,可以做到不同人、不同时段在同一个位置看到的广告是不一样的,或者,同一个时间点,同一个位置,不同人看到的广告也是不同的。比如有100个商家的广告需求和素材,整个DSP平台的过程,首先是不同用户的行为日志进行分析,把用户的URL请求和用户cookie相关的记录传过,在中间Ad Exchange上基于统计规则和算法模型等进行计算,并将计算结果反馈给广告主,广告主根据用户画像的结果通过实时竞价系统RTB进行竞价,最后结合计算和竞价结果给不同的用户展示不同的广告。
国美在线通过很多外部和内部媒体实现DSP广告的个性化投放。金融理财产品也像其他商品一样根据客户的标签进行推荐,效果非常好。
关于比价,跟精准营销有一些关系,但主要是大数据方面。比价平台需要实时地把同行各电商网站的数据爬下来,爬下来之后做一个比对,再帮助用户划分好类别,如果消费者通过这个比价平台看到的价格基本上是比同行低的,而且是他们想要的商品,购买转化率就比较高。
热力图工具主要是内部使用的一个工具,针对网站的首页,实时的把首页的每个资料位,有多少点击,流量是增加还是减少,后面的转化是怎么样的,会实时的展示出来,从而实现智能化的选品和智能化的运营,帮助业务调整买品和价格。商品销量不理想或者库存告急的商品是需要更换,热销商品要是太靠后了,就要往上放一下。这些通过热力图工具页面就可以显示出来。
其实后台的标签系统做好之后,可以有很多其他的应用,例如,将标签应用API接口,给其他应用端提供支持,可以与推荐、搜索、广告和第三方新闻等对接;或者是跟营销去对接,提供可视化的分析,城市的人群分布,不同性格的人群分布,成果实时的生成等。
清华大数据思享会是面向清华大数据产业联合会成员的思想交流的平台,定位为小范围的深度交流,目标是希望通过思想交流与碰撞促进产业的数据创新,推进大数据与产业和资本的融合,为各参会嘉宾带来工作和研究等方面的新灵感和启发。关于后续思享会的安排敬请关注数据派公众号(datapi)以及清数D-Lab服务号(Tsingdata)的内容, [email protected]
编译:数据派
整理:王文娟、张琳
校对:胡蝶
注:本稿件摘自数据观入驻自媒体—数据派,转载请注明来源。微信搜索“数据观”获取更多大数据资讯。
责任编辑:陈卓阳