新零售智能引擎事业群出品
代码:https://github.com/szhaofelicia/EchoChamberInEcommerce
一. 前言
个性化推荐系统在为用户带来更精准商品的同时,也对消费者的兴趣偏好和行为造成影响,例如回音室效应。回音室是指用户不断接受相似的信息和内容, 从而使得他们的兴趣或者态度被不断强化。这种现实通常出现在社交媒体和网络平台,也同样可能出现在电子商务等推荐系统中。我们的研究集中在电子商务的推荐系统对用户兴趣的影响,利用淘宝的大规模用户数据检验是否存在回音室效应。
根据回音室效应的定义,我们分两步检验其影响。首先,我们将测量用户的兴趣是否被强化。如果用户兴趣确实被加强, 接下来我们观察强化效应是否是接收的内容造成的,即系统推荐的商品被限制在逐渐缩小的范围内。也就是说,我们同时需要检验是推荐系统中是否存在过滤气泡的现象。我们在实验中采用分组对比的方法,利用聚类算法和有效性指标从群体水平分析用户受到的影响。实验结果证明电子商务系统,即淘宝平台,用户的点击行为中的确出现了回音室效应。然而, 这个现象在用户的购买行为中被削弱了。
二. 回音室和过滤气泡效应的背景
回音室(echo chamber)和过滤气泡(filter bubble)效应都是个性化推荐系统造成的负面影响,这两个概念并不独立。回音室效应[2]描述了由于不断接触相似的信息,用户喜好被持续强化的现象,而过滤气泡效应则解释了推荐系统会把用户隔离在一致,单一的信息环境中[5]。由此可见,过滤气泡效应是造成回音室效应的一种因素。
在社交媒体中,回音室和过滤气泡效应都会导致社会群体的分裂和观点的极化[1]。很多研究集中在脸书,推特等平台出现的回音室效应,这些研究认为个性化的内容推荐造成了线上社群的极化和虚假内容的传播 [3]。另一部分研究集中在推荐系统中的回音室效应,他们利用模拟的数据预测推荐系统如何影响用户兴趣[2]。回音室加剧了平台内容的极化,而过滤气泡效应则进一步降低了的多样性。
然而,目前的研究仍存在一定局限性。其中一个明显的问题是很多结论不是基于实时数据而是仿真或是自定义的模型下的结果。另外一个问题是很多研究混淆了回音室和过滤气泡的定义。很多研究将它们混为一谈,或是只研究其中之一回避了两者的相关性。我们的研究解决了上述问题:一方面,在检验回音室效应的同时也检测可能造成其的因素,即过滤气泡效应;另一方面,来自淘宝的实时数据使我们不必使用仿真去验证推荐系统对用户的影响。
三. 研究问题和解决方案
我们的目的在于研究电子商务推荐系统对用户影响。不同于社交媒体和其他类似的平台,用户的兴趣偏好在电子商务系统更加多样和复杂。例如在社交网络中,我们可以将用户的观点归类为正反两个的方向,即支持和反对,观察任一方向的强化即可验证系统对用户偏好的影响。但是在电子商务中,用户的喜好围绕各类商品,多种类型的产品导致我们无法用“正反”来定义用户的兴趣。电子商务中的用户行为也为我们的研究增加了难度,我们很难观察到评论,添加删除好友等社交网络中具体明确的行为。用户和平台的交互以间接的方式构成推荐系统和用户的相互影响,因而我们的测量只能利用购买,浏览,点击等用户的历史记录。基于以上两个特征,我们选择测量群体水平的变化,利用聚类的方式分析用户兴趣特征,并观察群体水平推荐内容的多样性变化趋势。我们的方法可以总结为以下两个问题:
(1) 我们测量一段时间内用户喜好的变化,判断用户兴趣是否被强化。
(2) 如果用户兴趣的确得到加强,我们接下来检测这是否是因为用户接触的内容被限制,多样性降低。
我们采用已有研究中的方法[4],利用分组的方式,根据用户采纳推荐商品的频率将用户分为采纳推荐组(Following Group)和不采纳推荐组(Ignoring Group)。对比两组的结果,我们可以观察到推荐系统对用户的影响。以上方法有效地检测电子商务场景的回音室效应,论文的贡献具体为以下几点:提出群体水平 的聚类分析方式;根据用户行为分组,从而测量回音室的影响;我们的实验使用实时用户数据,并分别研究了用户点击,购买行为的变化。
四. 数据集
我们采用淘宝用户的数据集,涵盖86192用户从2019年1月1日到5月31日共五个月的三种记录:浏览,点击和购买(表1)。我们只使用后三个月的数据以确保用户已经熟悉淘宝平台的各项功能。随后根据用的clicked PV (clicked page review), 抽取出Following Group和Ignoring Group两组用户。我们将至少包含一个点击商品的推荐列表定义为clicked PV,并计算全部PV中clicked PV的比例—PVR (page review ratio)。如图1所示,PVR在20%以下的用户归入Ignoring Group,PVR在80%以上的用户以下的用户归入Following Group。分组之后,我们共得到六组数据(表2)。
为了提取用户兴趣嵌入向量(user embedding)和产品嵌入向量(item embedding),我们将用户记录划分为小区间(block)。每个区间包含相同数量的记录,例如用户的点击,浏览和购买。通过比较三个月中第一个(first block)和最后一个区间(last block)的用户兴趣变化,我们就可以检测推荐系统在这段时间造成的影响。采用目前最先进的方法之一[6],我们提取出产品嵌入向量(item embedding)用于测量内容多样性,并计算每个区间的平均产品嵌入作为用户兴趣嵌入(user embedding)用于检测用户兴趣强化。
表1 实验数据
图1. 用户分组
表2 用户分组数据
五. 测量方法和结果
(一) 测量用户兴趣强化程度
我们先用霍普金斯统计量(Hopkins statistic)确认每组数据都可以产生有效的距离结果,计算结果用H表示。这项指标代表了数据的聚集程度,当指标超过0.5时,数据集有聚类倾向,计算公式如下:
S¬¬i和t¬¬i分别表示采样数据在随机数据和待测数据集的最小近邻距离。如表3所示,所有用户组数据均有聚类倾向。
表3 霍普金斯统计量
由于我们采用k-平均演算法(k-means clustering), 我们需要为每组数据选择最优的聚类数量,即K*。考虑到高维嵌入向量的复杂性,我们使用贝叶斯信息量准则(Bayesian information criterion,BIC)选取合适的K。BIC越高,说明K越适合数据集。贝叶斯信息量准则通常用于模型的最大似然估计,我们采用适用于切割式分群聚类的计算公式:
K表示聚类数量,ni表示聚类的大小,Σ表示方差,N为数据集大小。
图2 BIC
.各组数据的BIC曲线如图2,点击嵌入向量Following Group和Ignoring group的K分布是24和20,购买嵌入向量Following Group和Ignoring Group的K分布是11和9。由于峰值附近的的曲线较为平滑,我们把k的范围扩展到[K-5, K+5],各组的范围分别是[19,29],[15,25],[6,16]和[4,14]。
随后我们分别测量各项k值下的聚类有效性指标(clustering validity index),CH(Calinski-Harabasz index)和ARI (Adjusted rand index)。
测量CH指标时,我们只对第一个区间的嵌入向量进行聚类,直接将结果应用在最后一个区间对应的嵌入向量,之后测量两个区间的CH指标 (公式如下)。CH指标越高,聚类结果类间越分散,类内越聚集,聚类结果越好。在我们的实验中,CH指标下降较少的用户组则兴趣强化的程度较高。SSBK和SSWk分布表示类间和类内的平方距离,N表示数据集大小。
结果如图3和表4所示,无论是点击嵌入向量还是购买嵌入向量,Following Group的CH都下降较小,说明该组用户兴趣被强化。
图3 CH
表4 各组用户CH指标下降值
ARI的测量结果也印证了这一结论。不同于CH,ARI可以看做两个不同聚类结果的相似度,通常被用来比较待测结果和最优结果的差距。ARI数值越高,说明两个聚类结果越接近。我们利用ARI测量同组用户前后两个区间数据各自的聚类结果,估计嵌入向量的变化。ARI计算公式如下:
pi和qj分别表示不同聚类的数据,n¬ij表示两个聚类i,j共同包含的数据。
从图4和表5可得,Following Group的用户兴趣受到的影响更大。无论是点击还是购买嵌入向量,Following Group的ARI都较高,说明聚类结果变化小。但是,购买嵌入向量的两组ARI差距不大,并不显著。
表5 各组用户的ARI指标
图4 ARI
(二) 推荐内容多样性变化趋势
基于聚类分析的结果,我们可以确定Following Group的用户兴趣的确被强化了。接下来我们检测这一差异的原因,即推荐内容多样性的变化。
我们通过计算每个用户在同一区间内各产品嵌入向量的欧式距离(公式如下),利用同一区间的距离均值表示推荐内容的多样性。平均距离越大, 说明推荐的内容越丰富。
之后我们计算同一组用户区间的平均推荐内容多样性,结果如表6和图5 所示。尽管存在多样性下降的整体趋势,分组结果显示只有Following Group存在推荐内容多样性降低,Ignoring Group的下降并不显著。
表6 推荐内容多样性均值
图5 各组用户推荐内容多样性的分布
我们可以推断,Following Group用户兴趣加强是由推荐内容多样性降低造成的。
六. 结论
根据实验结果,我们可以确定用户兴趣受到推荐系统影响,倾向于采纳推荐产的用户其偏好会逐渐增强。回音室效应的出现正是由于用户接触的信息范围变窄,推荐内容的多样性逐渐下降。我们同时也观察到回音室效应在不同用户行为中的程度并不一致。就点击行为表现出的用户偏好而言,这种影响较为明显,但购买行为体现出的用户喜好则较为稳定,回音室现象一定程度被抑制。我们认为这是由于购买行为受到客观因素的限制,用户并不能完全依照兴趣喜好消费商品。
我们今后的研究将基于这个结果,设计并构造能够有效降低回音室和过滤气泡效应的推荐算法,为电子商务平台的用户带来更有效多样的推荐。
七. 参考文献
[1] Pranav Dandekar, Ashish Goel, and David T Lee. 2013. Biased assimilation, homophily, and the dynamics of polarization. Proceedings of the National Academy of Sciences 110, 15 (2013), 5791–5796.
[2] Ray Jiang, Silvia Chiappa, Tor Lattimore, András György, and Pushmeet Kohli. 2019. Degenerate feedback loops in recommender systems. In Proceedings of the 2019 AAAI/ACM Conference on AI, Ethics, and Society. 383–390.
[3] Sina Mohseni and Eric Ragan. 2018. Combating Fake News with Interpretable News Feed Algorithm. arXiv preprint arXiv:1811.12349 (2018).
[4] Tien T Nguyen, Pik-Mai Hui, F Maxwell Harper, Loren Terveen, and Joseph A Konstan. 2014. Exploring the filter bubble: the effect of using recommender systems on content diversity. In Proceedings of the 23rd WWW. ACM, 677–686.
[5] Eli Pariser. 2011. The filter bubble: What the Internet is hiding from you. Penguin UK.
[6] Jizhe Wang, Pipei Huang, Huan Zhao, Zhibo Zhang, Binqiang Zhao, and Dik Lun Lee. 2018. Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba. Proceedings of the 24th ACM SIGKDD (2018).
更多信息检索技术内容请查看:独家下载!《SIGIR 顶会论文解读》电子书重磅发布