推荐策略产品经理基础知识——搜索系统逻辑(下)

我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  
前面说到了query主要由query预处理、意图识别、query分词、query改写4个部分组成,query预处理已经介绍过了,下面就看看另外3个组成部分。
推荐策略产品经理基础知识——搜索系统逻辑(下) 意图识别

意图识别的本质就是分类问题,主要是根据业务需求进行用户意图分类,分为几个大类,收集每种意图类别下的常用词进行模型训练,模型准确率越高,意图识别效果越好。意图识别在搜索系统中是必不可少的,意图识别在很大程度上决定了用户搜索质量的好坏。

意图识别的难点:

输入不规范;就像上面提到的,不同用户对同一个内容的认知存在差异,输入的搜索词也会存在不小的差异;

数据冷启动,用户行为较少数据较少,意图获取会相对没那么准;

多意图识别,无法定位精准意图,例如用户搜索“车”,无法知道是想要玩具车还是四轮真车,或者是摩托车;

业界没有固定的评价标准,只有不同业务直接自己划分的分类进行的模型分类准确率计算,而一些业务指标例如ctr、cvr、pv等指标,都是评价整个搜索系统的,具体到意图识别上的量化指标却没有。

query分词

query分词主要是对用户搜索词进行切分,根据切分的词去进行改写以及后续的召回逻辑,不同业务的切词方式及自由切词库是有差异的。

query改写

这一步主要是针对用户搜索词进行纠错、以及同义词扩展召回等。需要做纠错词表或纠错模型,例如将“火才人”纠错为“火柴人”,将“超级猫丽奥”纠错为“超级马里奥”,将“校园”扩展为“学校”、“老师”、“教室”、“同桌”等等,同义词扩展里面会存在一些干扰词,需要根据实际业务对头部搜索词的同义词进行自定义切词表或自定义同义词表等。

推荐系统逻辑和搜索系统逻辑都介绍完了,下篇文章给大家说说它们之间的区别,也算是一个总结,欢迎继续关注。

以上就是“推荐策略产品经理基础知识——搜索系统逻辑(下)”的内容了,如果你还想了解其他相关内容,可以来 产品壹佰 官方网站。

随意打赏

提交建议
微信扫一扫,分享给好友吧。