如何从0到1做电商用户画像建模?
用户画像,其实就是通过算法聚合成一类实现用户信息标签化。而本文就以电商用户为例,展示了如何从0到1做画像建模。
一、构建用户画像
① 用户画像信息:基本属性,购买能力,行为特征,兴趣爱好,心理特征,社交网络
② 行为建模:文本挖掘,自然语言处理,机器学习,预测算法,聚类算法
③ 数据收集:网络日志数据,用户行为数据,网站交易数据
作用:了解用户的行为习惯,个性化营销及精准广告
- 静态数据来源:来源于用户填的个人信息,及算法模型预测的数据
- 动态信息数据: 用户行为产生的数据:注册,浏览,点击,购买,签收,评价,退货等
—比较重要的行为:购买商品,浏览商品,放入购物车,关注商品等
根据行为可以得出标签: 潮妈族,纠结商品,最大消费,退货数量,败家指数,品牌偏好,用户活跃度等
确定标签与根据算法猜测的标签
- 确定的标签:比如用户购买了或者收藏了某个商品等
- 猜测的标签:比如用户的性别,是男性的概率0.8。
另外还有很多模型:孕妇模型,潜在汽车用户模型,用户价值模型
比如:用户活跃度(活跃,沉睡,流失,未购买) 用户分群:电脑达人,数码潮人,家庭用户,网购达人,奶爸奶妈,单身贵族,闪购用户,时尚男女等
二、用户画像建模
1. 客户消费订单表
根据用户消费的情况来提取的客户标签,用以了解用户的消费情况,消费习惯。
(1)客户消费订单表标签 :
购买信息:
客户ID,第一次消费时间,最近一次消费时间,首单距今时间,尾单距今时间,近30/60/90天购买次数/购买金额(不含退拒),最大/最小消费金额,累计消费次数/金额(不含退拒) 累计使用代金券金额,客单价(含退拒),常用收货地区,常用支付方式,退货商品数量,退货商品金额,拒收商品金额/数量,最近一次退货时间,各地点下单总数/总额,上下午下单总数/总额。
购物车信息:
最近30天购物车商品件数/提交商品件数/购物车成功率/购物车放弃件数
(2)提取标签的作用
- 确定用户什么时候来的,多久没来了:第一次消费时间,最近一次消费时间,首单距今时间,尾单距今时间。
- 最近消费能力:近30天购买次数(不含退拒),近30购买金额(不含退拒),近30天购买次数(含退拒),近30天购买金额(含退拒)。
- 总体的消费情况:最小/大消费金额(可做个性化商品推荐),累计消费次数(不含退拒,可以计算客单价),累计消费金额,累计使用代金券金额(代金券爱好。)
- 消费属性:常用收货地区,常用支付方式。
- 购物车习惯:最近30天购物车次数,最近30天购物车提交商品件数,最近30天购物车商品件数,最近30天购物车放弃件数,最近30天购物车成功率。
- 退货和习惯特征:退货商品数量,拒收商品数量,退货商品金额,拒收商品金额,最近一次退货时间 用户购物时间及地点习惯:各下单地点总数,各时间段下单总数。
2. 客户购买类目表
—根据客户购买类目的情况提取的客户标签,用以了解类目的购买人群情况 。
客户购买表标签:
客户ID,一级/二级/三级分类ID/名称,近30天/90天/180天购买类目次数/金额,累计购买类目次数/金额,累计购买类目次数/金额,近30天/90天/180天购物车某类目次数/金额,累计购买类目次数/金额,累计购物车类目次数/金额,最后一次购买类目时间/距今天数
3. 客户购买商店表
根据客户购买商店的情况提取的客户标签,用以了解商店及品牌的购买人群(做品牌营销等) 客户。
购买商店表标签:
用户ID,商店ID/名称,品牌ID/名称,最近30天购物车次数/商品件数/提交商品件数/成功率/放弃件数,最后一次购物车时间,最近90天商品排除退拒商品件数/金额,最近90天货到付款订单数,最近90天退换件数/金额,最近90天拒收件数/金额.
4. 客户基本属性
根据客户所填的属性标签与推算出来的标签,用以了解用户的基本属性(可用以个性营销,生日营销,星座营销等)。
客户基本属性标签:
客户ID,客户登录名,性别,生日,年龄,星座,大区域,省份,城市,城市等级,邮箱,邮箱运营商,加密手机,手机运营商,注册时间,登录ip地址,登录来源,邀请人,会员积分,已使用积分,会员等级名称,婚姻状况,学历,月收入,职业,性别模型,是否孕妇,是否有小孩,孩子性别及年龄概率,是否有车,潜在汽车用户概率,使用手机品牌/档次,用户忠诚度,用户购物类型,身材,身高。
数据来源:
用户表,用户调查表,孕妇模型表,马甲模型表,用户价值模型表等 根据算法得出的标签。
其中模型:
性别模型:用以推算用户的购买用品的性别倾向(不一定是真实性别)
(1)性别模型
用户性别:1男,0女,-1未识别 | 1,商品性别得分,2,用户购买商品性别得分。
孩子性别:0仅有男孩,1仅有女孩,2,男女均匀,3,无法识别 |1,选择男童女童商品等
性别验证: 随机抽样调查 ,与用户填写性恶爆匹配。
(2)用户购物模型
两种归类:
用户购物类型:
- 购物冲动型
- 海淘犹豫型
- 理性比较型
- 目标明确型
- 未识别
构建:
- 计算用户在对三级品类购物前流量时间和浏览sku数量
- kmeans聚类
用户忠诚度模型:
用户忠诚度:
- 忠诚型用户
- 偶尔型用户
- 投资型用户
- 浏览型用户
- 未识别
构建:
- 只浏览不购买
- 购买天数大于一定天数
- 购买天数小于一定天数,大部分只有优惠彩购买 等
5. 客户营销信息表
将用户营销相关的常用标签放到一张表中,方便使用。
- 客户营销信息表: 客户ID,营销手机号,第一个有效订单来源/地址/手机号,常用的手机号,常用的收货地址,不同收货地址的数量,客户分群,活跃状态,用户价值(重要,保持,流失等),纠结商品,纠结小时
- 主要来源表: 用户表,订单表,活动表,购物车表。
其中模型:
(1)客户活跃状态模型
客户一般的活跃状态:
- 注册未购买(只注册未购买,多事第三方登录)
- 活跃(可以细分为高频,中频,低频)
- 沉睡(近90天无购买,近60天无购买)
- 流失 (近90天无购买,曾经购买)
(2)用户价值模型
体现用户对网站的价值对提供用户留存率非常有帮助
使用RFM实现用户价值模型参考指标:
- 最近一次消费时间(Recency)
- 消费频率(Frequency)
- 消费金额(Monetary)
RFM 实现用户价值模型计算方法:
- 使用指标:租金一次购买时间,近180天购买订单量,近180天购买金额,分N段进行RFM分数计算
- 算出Recency_score,Frequency_score,Monetary_score,然后划分用户群
6. 客户活动信息表
根据客户参与活动的情况提取的客户标签,用于了解用户对活动的参与情况,以进行活动的策划
客户活动信息表内容标签:
客户ID,用户促销明个度,满减促销敏感度,打折促销敏感度,换购促销敏感度,满赠促销敏感度,购买力分段,品牌偏好,品类偏好,颜色偏好,败家偏好,冲动偏好,累计积分,已用积分,可以积分,累计代金券数量/金额,已用代金券数量/金额,过期代金券数量/金额,可用代金券数量/金额
标签作用:
确定用户喜欢那种活动类型:用户促销敏感度,满减促销敏感度,满赠敏感度,打折促销敏感度,换购促销敏感度,团购促销敏感度等
促销敏感度模型:
根据用户购买的活动类型订单数与金额数已判断其属于哪类人群
用户有什么偏好:店铺偏好,品牌偏好,品类偏好,颜色偏好 用户指数:购买力分段,败家指数,冲动指数 用户购买力高中低模型:
—从购物车,客单价来判断 用户购买力高中低端模型:
- 从购物车来判断
- 从客单价来判断
指数模型:
败家指数:
- 使用购买特征山炮数量来识别(刚出的苹果产品,奢侈品)
- 结合用户的订单金额
冲动指数 :
- 使用特征商品(同品类价格较高商品)平均购物车停留时间
- 结合特征商品(同品类价格较高商品)的购买数量
7. 客户访问信息表
根据客户访问的情况提取的客户标签以了解访问习惯。
客户访问信息标签:
最近一次/第一次pc端访问日期/session/cookies/pv/使用浏览器/操作系统/,最近一次/ 第一次app端访问日期/操作系统,最近一次/第一次访问ip/访问城市/省份,近7天/15天/30天/60天/90天app端/pc端访问次数,近30天pc端/app端访问天数/访问并购买次数/访问pv/访问评价pv/ip数/,app及pc端各时间段访问的次数。
本文由 @Ethan 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CCO协议。