一文解读垂直搜索引擎和个性化推荐的应用逻辑
既谈垂直搜索引擎和个性化推荐,就绕不开AI。AI已是众人皆知,虽源于AlphaGo大声在围棋界一战成名,但人工智能的热门商业应用则是无人驾驶、百度和Google这样的搜索引擎、让今日头条发家致富的个性化推荐等。
而上述这三者,无人驾驶声名远扬憾在未正式商用普及大众,而其他两个则渗透在我们生活的方方面面。
搜索自不必多说,不懂就问是我们对搜索最基本的了解和诉求。而个性化推荐则不因个人意志为转移,因为商品被推荐与否,哪些商品被推荐,我们没有决定权。
今天就来说一说“搜你所想”的垂直搜索引擎和“想你所想”的个性化推荐引擎的应用逻辑。
垂直搜索引擎的应用三阶段
大多数人对于搜索引擎的第一反应可能都是Google或百度,因为我们习惯了在百度主动查询一些内容,而对方也几乎达到了有求必应的能力。而这不是我们今天所要讲述的垂直搜索引擎。
垂直搜索引擎是网站/APP里提供的搜索窗口,让用户通过搜索关键词就直达目标内容。比如淘宝里搜索“书包 男士 双肩”,搜索结果的展现几乎与搜索词无异。在资讯类APP里搜索“香港”会出现与之相关的大量新闻。
如果稍加留意和思考的人,可能会想搜索“香港”出来的结果会是怎样?这便是搜索引擎的奥妙所在。你的只字片语所能获得的结果满意度,是搜索引擎能优良与否的一个标准。在我看来,搜索包括三阶段:搜索词输入阶段、搜索结果展现阶段、搜索结果自定义调整阶段。
就以搜索“香港”为例说明垂直搜索引擎的三阶段。
阶段一:搜索词输入阶段是用户表达意愿需求的阶段
用户在搜索框中输入香港的过程中可能会错误地输入为“xiang gang”、“xiagngang”等,此时搜索引擎需要做的就是对搜索词进行语义分析识别用户搜索意图进行自动纠错,也就是明白用户想要的是什么,力求做到“用户可以写错,不能答错”。而与此同时,搜索框下方会出现一系列与“xianggang”相关的提示词,例如“香港20周年晚会”、“香港20周年阅兵”等与“香港”相关的内容,减少用户输入时间,提高用户的输入效率。
阶段二:搜索结果展现阶段
此处必须引出两个概念:召回率和搜索精度。
召回率(recall)就是是否把用户想要的东西都搜出来,网站明明有此产品却没有出现在搜索结果中,就是召回率不足的表现。
而搜索精度(precision)就是搜索出来的东西是否是用户想要的。用户在搜索提示中点击“香港20周年晚会”,那么出现的搜索结果应该与之相关,且全部搜索出来。
“智能排序”又是一个不得不提的概念,给用户返回的搜索结果中,与香港20周年晚会相关的最优质的搜索结果是否排在最前。
阶段三:搜索结果自定义调整阶段
此时就是用户根据自己的意愿进行搜索结果排序和筛选。比如只想看近11小时内的”香港20周年晚会”发布视频,这就是一个用户对搜索结果筛选的过程,可以更快更好地找到目标搜索结果。
前面已说过垂直搜索引擎的三个应用阶段,下面来说一说怎么个性化推荐的应用。
个性化推荐应该只顾个性还是多样化推荐?
今日头条仅凭一个非常简单的移动产品就可以迅速攀升到资讯类第一的地位,得益于其领先的个性化推荐技术,其定位“你关心的,才是头条”足以反映个性化推荐战略对今日头条的意义。淘宝网更是将个性化推荐发挥到极致,首页的每一个模块都是个性化的影子,几乎是想把每位用户沉溺在里面。
即便今日头条和淘宝这两款产品已经有了关于我比较完善的用户画像,能够根据我的喜好进行推荐,但是我的使用率却越来越低。究其原因,如下两点:
不具备多样性,拿今日头条来说,我只是在这一刻喜欢看军事新闻而已,但记下来的推荐内容一直是军事新闻,居心何在?不能带给我惊喜。那淘宝来说,我现在想买条裤子,但并不代表我对好看的上衣没兴趣,所以推荐中如果有让我眼前一亮的上衣,我会选择多逛一会。因为优秀的个性化推荐并非用户看过什么就接下来推荐什么。而需具备多样性和新颖性,让用户有惊喜感,而这远比简单的同类推荐要复杂。无论是资讯还是电商产品,有些用户在“闲逛”时会带有一些盲目性和消遣性,此时富有惊喜感的产品被推荐可以大大提升用户的好感度。
所以优秀的推荐引擎必须建立在多样性、新颖性的基础上,用数据来调整策略,而不是单纯着眼于当下进行单一类型推荐。
尤其需要注意的一点,对于资讯类产品而言,所推荐产品的时效性也是个不可忽视的因素。
资讯类产品如果想要依靠个性化推荐提升用户粘性,增加付费转化,必须明确在哪个场景使用个性化推荐是适当的,是首页的信息流推荐、详情页的相关推荐还是其他使用场景,依靠数据来调整个性化推荐的使用策略。另外,多样性推荐是可以根据占比由企业自行决定的,当然这也需要数据对比支撑不断调整占比,而时效性的资讯也可以根据统计的数据进行合理排布。
垂直搜索引擎和个性化推荐二者相辅相成
搜索和推荐虽然有很多差异,但两者存在着大量的融合。越来越多的搜索引擎会结合推荐系统的结果,而“相关搜索词”就是推荐系统的产物。比如在一些平台型电商网站中,由于结果数量巨大,且相关性并没有明显差异,因而对搜索结果的个性化排序有一定的运作空间,这里融合运用的个性化推荐技术也对促进成交有良好的帮助。
推荐系统也大量应用用了搜索引擎的技术,搜索引擎解决运算性能的一个重要的数据结构是倒排索引技术(Inverted Index),而在推荐系统中,一类重要算法是基于内容的推荐(Content-based Recommendation),这其中大量运用了倒排索引、查询、结果归并等方法。另外点击反馈(Click Feedback)算法等也都在两者中大量运用以提升效果。