推荐策略产品经理基础知识——推荐系统逻辑(下)

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
前面给大家简单介绍了召回的内容,下面就来看看排序。知识点比较多,都是一些比较关键性的,所以大家要耐心看完。
推荐策略产品经理基础知识——推荐系统逻辑(下) 排序——粗排/精排

粗排和精排,都是排序,一个需要快速排序尽量去掉错误召回,一个需要贴合用户和业务需求精细准确排序。

粗排在召回和精排之间,一般需求从召回回来的万/千级别item集合中选择出千/百级别更符合业务需求的item送到精排层。平台内容少时,几乎很少会做粗排这一步,因为粗排最大的作用就是快速计算并截断召回量,使召回数据更准更适合推给用户,一般粗排需要在20ms内完成打分。

如果没有粗排模型,也可以在召回层和精排层用一些策略进行数量截断进精排,也是一种粗排手段,例如用点击转化率进行截断。

精排处理数据量少,需要模型做到更准确,通常会上一些复杂模型以及使用较多特征。

粗排和精排层可以是一个模型打分,也可以是多个模型打分融合再进行排序,多数业务需求情况下多数都是多个模型,根据业务需求,模型的目标不一样,但基本上都会有点击模型(ctr)。

下面就单独就点击模型来讲一下模型是怎么打分排序的,讲排序之前需要先知道2个概念——label和features,这2个数据,是ctr模型的主要训练数据。

label:用ctr模型举例,每个模型都有label(模型的预测目标),ctr模型的label就是用户对当下曝光的item有没有点击行为,有曝光点击就为正样本,label=1,有曝光无点击则为负样本,label=0。

features:就是特征。特征主要分为3类:用户特征、item特征、用户和item的交叉特征。

用户特征:用户本身的特征,例如年龄、性别、地理位置等、登录设备(iOS/Android);

item特征:item本身的特征,例如标签、物品ID、天级点击次数、评论量、热门排名等;

用户特征和item的交叉特征:例如item天级的点击次数、周级点击人数、天级曝光次数等。

可以看出,features是我们在推荐系统都能够收集到的数据,其中有离散型特征(例如男女、分类、整数等),也有连续型特征(例如点击率、自然数)。

在计算机只能处理数字编码的前提下,将这些信息进行编码转化,大多数推荐系统对于离散型特征多使用one-hot或embedding,对于连续性特征可以不用处理,或者先分段离散化,再使用one-hot编码。

关于推荐系统逻辑就分享到这里了,下篇文章给大家介绍搜索系统逻辑,感兴趣的小伙伴可以继续去看看。

以上就是“推荐策略产品经理基础知识——推荐系统逻辑(下)”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。

随意打赏

提交建议
微信扫一扫,分享给好友吧。