新零售智能引擎事业群出品
1. 成交转化率预估:背景和挑战
电商推荐系统帮助用户寻找感兴趣的商品。在这个系统中,两个任务扮演了 至关重要的角色,点击率预估(CTR Estimation)和成交转化率预估(CVR Estimation)。顾名思义,点击率是商品从被曝光到被点击的概率,成交转换率 是商品从被点击到被购买的概率。 虽然学界和业界在 CVR 预估方面做了不少有意义的工作,但是工业应用中 的 CVR 预估仍然是个有挑战性的任务。我们总结了目前 CVR 预估还面临的三个 挑战:
- 数据中与购买相关的正反馈非常少;
- CVR 预估的训练数据稀疏(Data Sparsity);
- 样本选择偏差(Sample Selection Bias)。
首先,用户的决策过程是非常复杂的,但是训练数据中与购买相关的正反馈 不足。实践中我们发现,根据用户的购买行为得到的标签本身太稀疏了,不足以 帮助模型精准地推断用户的购物意图。比如在我们的生产数据集中有 36 亿条曝 光样本,但是成交数据只有 2700 万条,这意味着大多数的训练数据对于成交转 化率预估模型来说都是负样本。此外,购买本身是件门槛比较高的事情,没有最 终下单并不意味着用户没有任何购买倾向。 其次,CVR 预估任务的训练数据总体上比较稀疏。因为 CVR 预估任务需要 用点击的样本来训练,所以相比于 CTR 预估任务,CVR 预估任务的训练数据大 概要少两个数量级,因为用户的点击行为是稀疏的。对于一些模型中比较大的 embedding 特征(商品 ID 等),这样的训练数据是不够充分的。 最后,传统的 CVR 预估还存在着样本选择偏差的问题。CVR 预估模型是用 点击样本上训练的,但是在线服务的时候,却是对所有曝光的样本打分。因为点 击样本对应的数据分布可能和曝光样本的数据分布有很大的区别,就导致通过点 击样本学习到的 CVR,可能和真实的 CVR 之间产生偏差。 针对以上三个问题,我们提出了 GMCM(Graph-based Micro-behavior Conversion Model)这个模型。首先,GMCM 通过引入用户在商品详情页的控件 行为来缓解正反馈不足的问题。实践中我们发现,用户在下单前,通常会在商品 详情页产生一系列的微观控件行为(Micro behaviors)。这些控件行为和用户的 购买决策行为有很强的关联,在 GMCM 中我们把这部分信息引入到了 CVR 预估 模型中,并通过图卷积神经网络(Graph Convolutional Networks)来建模。此外针 对数据稀疏和样本选择偏差这两个问题,GMCM 采用了多任务学习(Multi-task Learning)以及逆倾向加权(Inverse Propensity Weighting)这两种方法来缓解以上 问题。
2. 现有的工作
一些 CTR/CVR 预估任务通用的模型包括,逻辑回归(Logistic Regression) , 因 子分解机(Factorization Machine),深度神经网络(Deep Neural Networks)等等。 最近很多方法关注于怎么通过用户的行为序列来更好的做 CTR/CVR 预估,典型 的工作包括阿里妈妈广告团队的深度兴趣网络(Deep Interest Network),深度兴 趣演化网络(Deep Interest Evolution Networks)等。 如上文提到,工业应用中的 CVR 预估模型面临数据稀疏和样本选择偏差两 个问题。已有的一些解法主要通过调整采样策略来解决以上问题。最近阿里妈妈 团队提出了一个转化率预估模型,ESMM(Entire Space Multi-task Model),通过 多任务学习共享 embedding 来缓解数据稀疏,通过引入了一个辅助的 CTCVR 任 务来解决样本选择偏差问题。 很少有工作研究怎么利用用户的微观控件行为。京东的一篇发表于 WSDM 2018 的工作是我们已知的第一篇利用用户微观行为做商品推荐的论文。在这篇 论文中,作者提出把用户的微观控件行为用序列模型建模。这样的建模方式可能 存在两个问题,第一是不同的微观行为顺序可能代表了相似的用户购物意图。比 如当用户考虑购买一件商品时,先点击图片还是先查看评论可能区别不大。第二 是微观行为之间往往是相互关联的,比如点击问大家的用户很可能也会查看评 论。基于以上两点观察,我们提出用图而不是序列来建模用户的微观行为。
3. 我们的工作
GMCM 旨在解决传统 CVR 建模中的三个实际问题,即与购买相关的反馈有 限,数据稀疏性和样本选择偏差。为了解决第一个问题,GMCM 把用户的微观行 为表示为了一个购物微观行为图(Purchase-related Micro-behavior Graph),并采 用 GCN 来捕获图上节点的相关性。在实践中,我们发现这些微观行为与用户购 买决策高度相关,因此可以作为推测用户购买意图的线索。此外,我们观察到这
些微观行为往往相互关联,并且不同顺序可能代表相似的用户购物意图。因此, 我们将微观行为表示为图而非序列。为了缓解数据稀疏性和样本选择偏差问题, 我们采用了多任务学习框架和逆倾向加权技术。具体来说,GMCM 同时训练 CTR 和 CVR 任务,并在两个任务之间共享嵌入层。这样嵌入特征就可以同时通过曝 光样本以及点击样本得到训练。此外,GMCM 通过估计一个点击倾向(即 CTR 分数)对 CVR 预测误差进行反向加权。这种逆倾向加权的方式在理论上可以完 全消除样本选择偏差,实践中,估计的点击倾向分数(即 CTR)肯定不是百分之 百准确的,不过已有的一些文献证明了类似方法在实践中确实可以降低样本选择 偏差带来的影响。接下来我们具体介绍 GMCM 模型的一些重要部分。 首先,我们把用户的微观行为表示为一个购买微观行为图(PMG)。在这个 图上,每个节点代表用户的一种微观控件行为,每条边代表两种微观行为之间的 连接关系。PMG 的示意图如下。
我们用训练数据中微观行为之间的统计共现概率来作为每条边权重的初始值,然 后让网络学习一个边权重的偏置矩阵,来自适应地调节不同行为之间的连接强 弱。 基于定义好的 PMG,我们用 GCN 来学习微观行为的表征,GCN 会通过每个 节点的输入特征,以及图的拓扑结构,来得到每个节点的一个表征。最终每个节 点的表征都会被用来计算一个分数,作为用户产生这一种控件行为的预测分,这 个预测分和我们样本中这个控件行为的标签计算 loss,辅助 CVR 预测任务的学 习。具体的计算过程见论文。最终 GMCM 的模型结构如下图所示:
我们使用了淘宝店铺内的底部接着逛和猜你喜欢两个场景的生产数据来评 测 GMCM 模型的性能。底部接着逛(SM)数据集包括 36 亿曝光,6.亿点击以及 2700 万成交样本。猜你喜欢(GUL)数据集包括 11 亿曝光,2.2 亿点击以及 2000 万成交样本。我们进一步把这两份数据按时间拆成了六个子数据集,目的是观察 随着训练数据量的累计,模型在预测集上的表现。整个实验旨在回答以下三个问 题:
- GMCM 是否优于目前最好的成交转化率预估模型?
- GCN 是否能帮助我们更好的建模用户的微观控件行为?
- 网络的一些超参数对于模型有什么影响?
我们采用了 AUC 和 MSE 两种指标来衡量模型的性能。大体而言,AUC 反应 了模型对于正负样本排序的好坏,MSE 反应了模型预估分数的准确程度。下表 为模型在 6 个子数据集上的表现:
我们发现 GMCM 模型在所有数据集上都得到了最高的 AUC/GAUC, 在大多数数据集上得 到了最低的MSE。进一步分析,我们认为GMCM 模型在预测集上性能的提升主要归功于 对用户微观行为的引入以及正确的建模。 我们做了一组消融实验,来对比不同的微观行为建模方式对于最终模型效果的影响。具 体来说,我们对比了GCN建模(图的方式),GRU建模(序列的方式),以及直接通过 全连接层建模这几种方式。最终的结论是GCN建模微观行为会取得最好的效果。实验结果 如下图所示:
4. 结论
在这项工作中,我们提出了一个全新的CVR预估模型GMCM,以解决工业应用中CVR 估计面临的三个问题:与购买相关的反馈有限,数据稀疏和样本选择偏差。我们提出将用户 的微观行为表示为与购买相关的购买微观行为图(PMG)。基于此图表示,我们将CVR估 计问题转化为了在PMG上的图分类问题。此外,我们还采用了多任务学习和逆倾向加权的 方式,来缓解数据稀疏和样本选择偏差等问题。在淘宝生产数据集上的实验证明了GMCM 的有效性。
5. 参考文献
[1]XiaoMaetal.,Entirespacemulti-taskmodel:Aneffectiveapproachforestimating post-clickconversionrate.The41st InternationalACMSIGIR [2]WenhaoZhangetal.,Large-scaleCasualApproachestoDebiasingConversionRate EstimationwithMulti-taskLearning,,theWebConference2020 [3]GuoruiZhouetal.,Deepinterestevolutionnetworkforclick-throughrateprediction, AAAI,Vol.33.5941-5948 [4]GuoruiZhouetal.,Deepinterestnetworkforclick-throughprediction,the24th ACM KDD [5]MeiziZhouetal.,Microbehaviors,AnewPerspectiveinE-commerceRecommender Systems,WSDM727-735 [6]ThomasNKipfetal., Semi-supervisedclassificationwithgraphconvolutional networks,ICLR2017
更多信息检索技术内容请查看:独家下载!《SIGIR 顶会论文解读》电子书重磅发布