Neural Graph Collaborative Filtering阅读笔记

2023-11-10 11:45:22

动机

本文是2019年SIGIR的一篇文章。在推荐系统中，用户和物品的向量表示(embeddings)是推荐系统的核心，但目前的方法都是根据用户（物品）原有的特征通过映射获取embeddings，并没有将用户与物品交互中的潜在的协同信号编码进embeddings，因此产生的embeddings可能不足以支持捕获协同过滤效果。本文提出一种新的图神经协同过滤模型(NGCF)，将协同信号显示地注入在用户物品的向量表示中。

算法

在本文中，作者通过利用用户项目互动的高阶连通性解决上述问题。举个栗子来说明大致思路，左子图是用户与物品交互图，图中\(u_1\)是我们感兴趣的用户，以\(u_1\)为根节点将左图转换成树结构（右图），高阶连通性指的就是那些从任意节点到\(u_1\)且路径长度l大于1的节点，例如\(u_1⬅i_2⬅u_2\)，这表示\(u_1\)和\(u_2\)行为相似，因为他们都对\(i_2\)产生过交互。

作者设计了一个嵌入传播层（基于GNN），通过聚合项目的embeddings来改进用户的embeddings，或者是聚合用户的embeddings来改进项目的embeddings。通过堆叠多个嵌入传播层来捕获高阶连接信息，例如，堆叠2层捕获\(u_1⬅i_2⬅u_2\)中用户的行为相似度，堆叠3层\(u_1⬅i_2⬅u_2⬅i_4\)发现潜在的推荐。

一层嵌入传播层

嵌入传播层由两个部分组成：信息构建和信息聚合。
信息构建：对于每一个用户项目交互对（u，i）来说，定义从i到u的数据为

\(m_{u⬅i}\)是信息嵌入，也是之后需要传播的信息。在本篇\(f(·)\)是编码函数，\(e_i\)和\(e_u\)分别是物品与用户的embedding，作为输入。\(p_{ui}\)是衰减因子。在本篇论文中，作者使用以下编码函数

\(W_1\),\(W_2∈\mathbb{R}^{d'×d}\)是可以训练的权重矩阵，用于提取有用信息，\(\odot\)表示向量对应元素相乘。根据图卷积神经网络，将\(p_{ui}\)设为\(1 / \sqrt{\left | \mathcal{N_u} \right | \left | \mathcal{N_i} \right |}\)，其中\(\mathcal{N_u}\)和\(\mathcal{N_u}\)代表用户u和物品i的第一跳邻居。我们也可以用相同的方法获得u到i的信息\(m_{i⬅u}\)

信息聚合：定义优化后u的信息表示为

\(e^{(1)}_u\)表示在第一个嵌入传播层后用户u的表示，其中\(m_{i⬅u}=W_1e_u\)。它不仅考虑到用户自己与自己的连接，还考虑到邻居传播的信息。我们也可以用同样的方法得到优化后的物品表示\(e^{(1)}_i\).

多层嵌入传播层

通过堆叠l个嵌入传播层，用户和物品能接收到l跳邻居传播的信息，在第l层中，用户表示为

消息传播表示为

模型预测

通过L个嵌入传播层，我们可以将L个嵌入传播层得到的用户（物品）表示连接起来作为它们最终的embedding

最后，使用内积计算用户对项目的偏好度

优化

在这里，作者通过优化成对的BPR损失来学习模型，损失函数定义如下

其中，\(\mathcal{R}^+\)表示可以观测到的交互，\(\mathcal{R}^-\)表示观测不到的交互，\(\Theta\)表示所有可以训练的参数。

与NGCF相关的工作

与NGCF相关的工作有基于模型的协同过滤方法，基于图结构的协同过滤方法和图卷积网络。基于模型的协同过滤模型利用用户物品交互矩阵，将用户与物品的id投影到一个embedding中，早期工作是利用用户和物品的embedding内积计算用户对物品的偏好度，近期有许多工作使用非线性的深度神经网络作为交互函数，尽管这类方法取得成功，但是嵌入函数的设计不足以产生优秀的embedding。基于图结构的协同过滤方法本质上属于基于邻居的方法，它缺乏模型参数来优化目标函数，在概念上不如基于模型的协同过滤方法。最近提出的HOP-Rec将基于图的方法与基于嵌入的方法相结合来缓解这个问题，但是HOP-Rec没有充分探索高阶连通性，并且极大程度依赖随机游走的结果。最后是图卷积网络，作者在本文中提出的NGCF就属于图卷积网络方法中的一种，另外还有一些其他应用到图卷积网络的工作，GC-MC使用一个卷积层利用用户与物品的直接连接，但它无法发现高阶的连通性。

结果

与当时最先进的模型相比，在本文实验所使用的三个数据集上Gowalla、Yelp2018及Amazon-book，NGCF均取得最好的效果。

因为NGCF中每层嵌入传播层捕捉到不同距离的信息，最后还将每层的嵌入向量聚合在一起，由此得到的用户（物品）表示向量包含了用户物品的交互信息，包含的信息更全面，因此会有更好的结果。更直观的可以从下图看出，该图星星表示用户，与用户连线的点表示为测试集中与该用户有交互的物品，相比与矩阵分解，NGCF-3中相同颜色的点更趋向于聚成一团。

总结

可学习的协同过滤模型有两个关键的组成部分，一个是用户与物品的embeddings的构建，另外一个是用户与物品的embeddings的交互函数。在上周读的《Neural Collaborative Filtering》这篇论文中是使用非线性深度神经网络作为用户与物品的embeddings的交互函数，本文是用图神经网络将用户和物品embeddings传播实现获得包含用户物品交互信息的embeddings，如果将这两篇论文中的方法结合，我认为会有更好的效果，作者也在文章中提到这个想法。将深度学习应用到推荐系统是目前的一个趋势，我在接下来也会探索更多这方面的知识。

码农公寓

动机

算法

一层嵌入传播层

多层嵌入传播层

模型预测

优化

与NGCF相关的工作

结果

总结

相关文章