IJCAI 阿里巴巴三篇 oral 论文摘要

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  

IJCAI 2018 于 7 月份在瑞典举行。阿里巴巴作为国内优秀企业,也有三篇论文被收录为口头报告论文。这一事件在雷锋网 (公众号:雷锋网) 旗下学术频道 AI 科技评论数据库产品 「AI 影响因子」 中有相应加分。

以下为三篇 oral 论文摘要:

基于改进注意力循环控制门的品牌排序系统

A Brand-level Ranking System with the Customized Attention-GRU

在淘宝网等电子商务网站中, 品牌在用户对商品做点击/购买选择时正起着越来越重要的作用, 部分原因是用户现在越来越关注商品的质量, 而品牌是商品质量的一个保证。但是, 现有的排序系统并不是针对用户对品牌的偏好设计的。某些处理方案一定程度上能减轻这个问题, 但仍然无法取得理想的效果或需要增加额外的交互成本。我们提出并设计了第一个品牌级排序系统来解决该问题, 该系统的核心挑战是如何有效利用电子商务网站中的大量信息来对品牌作个性化排序。在我们的解决方案中, 我们首先针对个性化品牌排序问题设计特征工程, 然后在 Attention-GRU 模型的基础上, 提出了 3 个重要改进, 以更好地对品牌排序。值得注意的是, 这些改进也能应用于很多其他机器学习模型。我们在阿里巴巴天猫商城上做了大量实验来验证这个排序模型的有效性, 并测试了真实应用场景中 用户对该排序系统的反馈。

JUMP: 一种点击和停留时长的协同预估器

在搜索和推荐场景中,基于会话的预测日益受到人们的兴趣和重视;大多这类算法都是基于递归神经网络 (RNNs) 技术或者它的变种。然而,已有的算法一方面会忽略「停留时长」在表达用户偏好程度上的重要性,另一方面在非常短或者有噪音的会话上会预估的不准。因此在该文章的的工作中,我们提出了一种联合预估算法 JUMP,基于会话去同时预测用户的点击和停留时长。JUMP 使用一种新奇的三层 RNN 结构去编码用户的一次会话,包括使用一个「快慢层」去缓解短会话的问题,使用一个「注意力层」去解决会话噪音的问题。大量的实验表明 JUMP 算法能在点击率预估和停留时长预估上,超越最新的其他算法。

电商搜索全局排序方法

搜索排序的传统方法是通过各种方法对商品进行打分,最后按照每个商品的分数进行排序。这样传统的搜索排序方法就无法考虑到展示出来的商品之间相互的影响。类似地,传统的针对单个商品估计 ctr、cvr 的方法也都基于这样一个假设:商品的 ctr、cvr不会受到同时展示出来的其他商品 (我们称为展示 context) 的影响。而实际上一个商品的展示 context 可以影响到用户的点击或者购买决策:假如一个商品周边的商品都和它比较类似,但是价格却比它便宜,那么用户买它的概率不会高;反之如果周边的商品都比它贵,那么用户买它的概率就会大增。如果打破传统排序模型展示 context 没有影响的假设,该如何进行排序呢?

为此,我们首次提出了一种考虑商品间相互影响的全局排序方法。我们将电商排序描述成一个全局优化问题,优化的目标是反应用户满意度的商品成交额:GMV(GrossMerchandise Volume)。准确地说,全局排序的优化目标是最大化 GMV 的数学期望。计算 GMV 的数学期望需要知道商品的成交概率,而商品的成交概率是彼此相互影响的,因此我们又提出了考虑商品间相互影响的成交概率估计模型。首先,我们提出了一种全局特征扩展的思路,在估计一个商品的成交概率时,将其他商品的影响以全局特征的形式加入到概率估计模型中,从而在估计时考虑到了其他商品的影响。然后,我们进一步提出了通过 RNN 模型来精确考虑商品的排序顺序对商品成交概率的影响。通过使用 RNN 模型,我们将电商排序变成了一个序列生成的问题,并通过 beam search 算法来寻找一个较好的排序。我们在淘宝无线主搜索平台上进行了大量的实验,相对于当时的淘宝无线主搜算法,取得了GMV 提升 5% 的效果。

雷锋网版权文章,未经授权禁止转载。详情见。

随意打赏

阿里巴巴企业文化阿里巴巴商学院阿里巴巴股东ijcai
提交建议
微信扫一扫,分享给好友吧。