推荐策略产品经理基础知识——推荐系统逻辑(中)
前面给大家简单介绍了召回的概念,下面就来看看多路召回的好处以及一些常见的召回路径。如果有不对的地方欢迎大家指正哦!
多路召回的好处:
提高召回率和准确率,这里不对这2个名词作解释,可以找相关文章自行查询;
个性化推荐的基础,用户多样性兴趣探索,多元化召回;
保证线上事故发生时还有存余召回兜底,避免推荐接口没有返回的数据;
贴近业务,各业务需求不一样,需要进行融合(广告召回、强插、item冷启动等)。
常见的召回路径 (策略都是需要数据支持且与场景强相关的):
1)协同过滤
基于用户的协同过滤,基于item的协同过滤;简单来说就是喜欢A内容的用户,还喜欢B游戏(这种召回方式比较老,现在很少有公司会用)。
协同过滤和用户及游戏都有关,矩阵,玩过就是1,没玩就是0,没玩过的游戏很多,很多都是0,所以会做矩阵分解:用户矩阵和商品矩阵,每一列就是用户向量或商品向量。
2)word2vec(词向量)
(最早用于NLP中)需要拿到用户的玩游戏序列,每个游戏做one-hot编码,会有一个神经网络模型,输入是A→B→?→D→E,输出是C,或A→B→C→D去预测E。
模型中间的隐藏层就叫词向量,和游戏有关,和用户没关,拿数据的时候和用户有关(向量用法:用户和游戏算相似度:用户A和游戏B向量做相似度计算;用户和用户、游戏和游戏)。
3)内容匹配召回
这一块主要和标签(类别)召回有关,比如:用户玩了王者荣耀,那么可以尝试召回推荐类似王者荣耀的吃鸡游戏,这是基于内容标签的召回;又或者用户玩了植物大战僵尸1,那么也可以尝试推荐植物大战僵尸2/3等,这是基于知识储备的匹配。
4)高热召回(热门召回)
这一路召回主要是新用户用的比较多,新用户刚来APP,拿不到过多的用户信息且没有行为,这种情况下,平台高热召回就起了大作用,用来做新用户冷启动;用户冷启动这里不做过多结束,后面会有专门的一节做介绍。
5)基于上下文的召回
这个和用户在APP发生行为的时间、地点等场景有关系,例如游戏推荐在白天碎片休息时间推荐小游戏,在晚上休息时间推荐大游戏、游戏时长较长的游戏等;在其他垂类上体现的话,就像打车垂类对于用户位置信息的敏感,用户刷新闻的时间等等。
6)级联召回
一般的召回是用户点击做正样本,级联是用精排排在前面的游戏做正样本,排在后面的做负样本,做召回模型的正负样本。
7)其他召回
根据业务需求,还会有其他召回,且每路召回的数量也有差异,例如为了让新用户快速留下来,新用户高热召回占比较大,但老用户的话,为了挖掘用户兴趣多样化,高热召回占比会相对小一点。
召回层也是有模型的,尤其是做电商业务,召回的模型会更复杂。
关于召回的内容就先介绍到这里了,下篇文章给大家讲讲另一个重要知识点:排序。继续去看看吧!
以上就是“推荐策略产品经理基础知识——推荐系统逻辑(中)”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。
多路召回的好处:
提高召回率和准确率,这里不对这2个名词作解释,可以找相关文章自行查询;
个性化推荐的基础,用户多样性兴趣探索,多元化召回;
保证线上事故发生时还有存余召回兜底,避免推荐接口没有返回的数据;
贴近业务,各业务需求不一样,需要进行融合(广告召回、强插、item冷启动等)。
常见的召回路径 (策略都是需要数据支持且与场景强相关的):
1)协同过滤
基于用户的协同过滤,基于item的协同过滤;简单来说就是喜欢A内容的用户,还喜欢B游戏(这种召回方式比较老,现在很少有公司会用)。
协同过滤和用户及游戏都有关,矩阵,玩过就是1,没玩就是0,没玩过的游戏很多,很多都是0,所以会做矩阵分解:用户矩阵和商品矩阵,每一列就是用户向量或商品向量。
2)word2vec(词向量)
(最早用于NLP中)需要拿到用户的玩游戏序列,每个游戏做one-hot编码,会有一个神经网络模型,输入是A→B→?→D→E,输出是C,或A→B→C→D去预测E。
模型中间的隐藏层就叫词向量,和游戏有关,和用户没关,拿数据的时候和用户有关(向量用法:用户和游戏算相似度:用户A和游戏B向量做相似度计算;用户和用户、游戏和游戏)。
3)内容匹配召回
这一块主要和标签(类别)召回有关,比如:用户玩了王者荣耀,那么可以尝试召回推荐类似王者荣耀的吃鸡游戏,这是基于内容标签的召回;又或者用户玩了植物大战僵尸1,那么也可以尝试推荐植物大战僵尸2/3等,这是基于知识储备的匹配。
4)高热召回(热门召回)
这一路召回主要是新用户用的比较多,新用户刚来APP,拿不到过多的用户信息且没有行为,这种情况下,平台高热召回就起了大作用,用来做新用户冷启动;用户冷启动这里不做过多结束,后面会有专门的一节做介绍。
5)基于上下文的召回
这个和用户在APP发生行为的时间、地点等场景有关系,例如游戏推荐在白天碎片休息时间推荐小游戏,在晚上休息时间推荐大游戏、游戏时长较长的游戏等;在其他垂类上体现的话,就像打车垂类对于用户位置信息的敏感,用户刷新闻的时间等等。
6)级联召回
一般的召回是用户点击做正样本,级联是用精排排在前面的游戏做正样本,排在后面的做负样本,做召回模型的正负样本。
7)其他召回
根据业务需求,还会有其他召回,且每路召回的数量也有差异,例如为了让新用户快速留下来,新用户高热召回占比较大,但老用户的话,为了挖掘用户兴趣多样化,高热召回占比会相对小一点。
召回层也是有模型的,尤其是做电商业务,召回的模型会更复杂。
关于召回的内容就先介绍到这里了,下篇文章给大家讲讲另一个重要知识点:排序。继续去看看吧!
以上就是“推荐策略产品经理基础知识——推荐系统逻辑(中)”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。