paper 5: KDD2021-Sliding Spectrum Decomposition for Diversified Recommendation

 

在一个大规模的推荐系统中,我们可以从三个角度来理解多样化的推荐结果: diversity, quality, fairness

  • quality: 供应与用户兴趣匹配
  • diversity: 发现/扩展用户兴趣
  • fairness: 对长尾和小众items公平

对于quality, 可以来自用户历史兴趣, 也可以是用户兴趣的发现和拓展. 我们可以对点击率, 时长等行为建模, 进而转化为分类/回归问题

对于diversity, 我们需要度量items之间的相似性, 例如DPP(determinal point process)

本文试图解决两个问题: quality和diversity之间如何获得一个较好的trade-off, 以及如何公平地衡量相似性

 

时间序列建模:

对于小红书的用户, feed可以看作他们观测到的一个一维时间序列, 每个时刻为一篇笔记

在经典的时间序列分析中,如西瓜的单价,以销售时刻为横轴, 我们可以建立时间序列, 并将其分解为经营成本、季节、噪声

时间序列可分解为 trend + sesonal + residual(noise)

from statsmodels.tsa.seasonal import seasonal_decompose

类似地, 下面我们尝试将笔记序列分解成几个正交的部分, 以衡量多样性

滑动频谱分解(Sliding Spectrum Decomposition, SSD)

 

paper 5: KDD2021-Sliding Spectrum Decomposition for Diversified Recommendation

上一篇:go tag的用法


下一篇:python用来获得图片exif信息的库源码