paper 5: KDD2021-Sliding Spectrum Decomposition for Diversified Recommendation

2023-12-15 14:35:09

在一个大规模的推荐系统中，我们可以从三个角度来理解多样化的推荐结果: diversity, quality, fairness

对于quality, 可以来自用户历史兴趣, 也可以是用户兴趣的发现和拓展. 我们可以对点击率, 时长等行为建模, 进而转化为分类/回归问题

对于diversity, 我们需要度量items之间的相似性, 例如DPP(determinal point process)

本文试图解决两个问题: quality和diversity之间如何获得一个较好的trade-off, 以及如何公平地衡量相似性

时间序列建模:

对于小红书的用户, feed可以看作他们观测到的一个一维时间序列, 每个时刻为一篇笔记

在经典的时间序列分析中，如西瓜的单价，以销售时刻为横轴, 我们可以建立时间序列, 并将其分解为经营成本、季节、噪声

时间序列可分解为 trend + sesonal + residual(noise)

from statsmodels.tsa.seasonal import seasonal_decompose

类似地, 下面我们尝试将笔记序列分解成几个正交的部分, 以衡量多样性

滑动频谱分解(Sliding Spectrum Decomposition, SSD)

码农公寓