在线购物者画像——消费者行为理解与预测
消费者消费是经济活动的主要部分。2015年,它占了美国GDP的68%,它经常用来衡量一个国家经济产出和普遍繁荣状况。这些年网上购物的人在不断增加,35岁以下的消费者数量占了总数的72%,他们在去实体店购物前就决定网上购物。同时显示出,网上购物开始受欢迎。2015年,消费者网上消费3490亿,比2014年增加了14%。随着网上购物的普遍,我们想找到一些重要问题的答案:包括哪些人购物频繁,什么时候是网上购物高峰,人们如何网上消费。
36大数据专稿,原文作者:Farshad Kooti, Kristina Lerman, Mihajlo Grbovic, Vladan Radosavljevic, Nemanja Djuric, Luca Maria Aiello 本文由36大数据翻译组-小金 ,任何不标明译者和出处以及本文链接http://www.36dsj.com/archives/43009 的均为侵权。
在调查的开始阶段,我们发现以前的网上购物行为研究已经限制了我们从调查或者仅特定购物网址中分析数据。我们决定采取不同的方法。大部分验证邮件里的促销结果都是商家发送给购物者的。这些邮件提供丰富的证据资源供我们研究网上消费者的行为。我们的研究报告:“在线购物者画像——消费者行为理解与预测”,已发表在第9届基于Web搜索和数据挖掘的ACM国际会议(WSDM2016)议程表中。结合用户人口统计特征如年龄,性别和邮编,我们 分析了2010万雅虎邮件用户的匿名购物小票,合计1.21亿次购物,金额51亿美元。
我们的分析产生了一些关于问题的有趣发现。我们开始通过年龄和性别在网上购物的影响研究: 发现女性更加容易网上购物(图1a),而男性是习惯性的购买昂贵的物品(图1b),如电视和冰箱。
为了得到收入在网上购物扮演的角色,我们使用了关于网上购物者邮编和中间值收入的数据库去估计用户的收入。 我们得出富裕地区的人们网上购物更频繁(图2a),购买的商品更昂贵(图2b),导致花费在网上购物的钱更多(图2c)。
接下来,我们研究人们网上购物的周期循环行为,然后发现了明显周模式和日模式。 人们在周一和周二购物次数更多(图3a),人们更喜欢在下午三点或者早上购物(图3b)。
我们得出的大小数据集让我们有机会测试几个有趣的假设:关于用户的预算意识和以社会目标为本的行为。 我们测试的第一个假设是:个人购物的决定不是独立的,受他们的经济水平约束。 为了测试这个假设,我们测试商品购买价格和消费者自上一次购物的时间间隔的关系。如果我们的假设是正确的,那么在一次购物之后应该有一个不反应期,用户等待一段时间后作出更大的一笔购物。为了测试我们基于用户分组的分析没有任何偏差,我们通过替换掉用户购买的商品价格来做一个随机测试。最后,我们清晰的看到一个正相关关系: 购物金额与自上一次购买的时间间隔(图4)(红)。并不是基于一堆随机的数据生成的水平线(蓝)。
然后我们假设个人的购物行为是跟他或她的朋友相关的,比如因为同质相吸,相互影响或者外部事件。为了调查社会相关性的存在,我们对比相互发送邮件的用户的购物行为和那些不喜欢邮件他人的用户的购物行为。我们将每个用户的购物历史用向量表示,然后计算用户使用余弦相似度的相似性。表一是我们对比一组随机用户得到的相互关联的不同分组的用户的购物 向量的平均余弦相似度。它确定了具有 社会性相关的用户的购物行为是更加相似的。
表1:相关用户vs随机用户的相似度对比
最后,我们使用数据测试下一次购物的时间和费用的预测准确程度。准确的预测可以帮助电子商务网站通过个性化和时间推荐提高个人购物体验。我们通过大量方法进行测试,包括人口统计特征,购物价格,时间历程,关联商品的购买,以及对比我们的结果与另外三个基准: 随机预测,早前的购买延迟/价格,以及最普遍的价格或者购买延迟时间。 我们使用不同的分类演算法和贝叶斯网络分类来产生最高准确度。为了预测条件机率分布,我们使用条件概率的直接预测方法:其中α 取值0.5。分类器是用前六个月的购物数据进行训练,用后两个月的数据进行验证评估的。我们可以实现31% 的准确率,预测下一次购物的时间和价格。预测结果的细节可以在表2找到。
表二:预测结果的总结
从发送雅虎邮箱用户的电子确认邮件中提取大量网上购物数据集,我们可以发现女人更喜欢网上购物,相比男人花费更多的时间精力。另外,我们确定 收入在人们的网上消费行为中扮演着重要的角色 。而且,我们构建了一个分类器去预测人们下一次购物的时间和费用,以及,通过对比竞争基准线我们实现更高的准确率。进一步而言,我们计划使用这些发现和分类器去制定更好的购物推荐。
基于大数据的用户画像构建(理论篇)
你确定你真的懂用户画像?
也来谈谈微博的用户画像
24页PPT:大数据用户画像的方法、实践与行业应用
什么是用户画像?金融行业大数据用户画像实践
End。