本文为随堂学习笔记 课程见慕课-->个性化推荐算法实战入门必修课
Collaborative filtering 协同过滤
背景 1.信息过载 --> 找到用户所需 2.强依赖用户行为
Item cf
给用户推荐他之前喜欢的物品的相似物品
如何衡量相似 -- > 喜欢两个物品的用户重合度越高,那么两个物品就越相似
如何衡量喜欢 -- > 信息流产品下,是否为真实点击 ,电商产品下,更看重实际转化 ==》一定时长的停留。故要结合具体的产品
物品 i 和 j 相似度计算公式:
user对item j 的推荐得分
N(u) : user行为过的item 的总数
rui : user对物品i的行为得分(比如电影评分系统中用户对电影的评分-->归一化0~1间的一个值)
Sij : 物品 i 和 j 的相似得分
item i 是用户行为过的物品且是与item j 最相似的top k个 item (一般实战中选取50个)
公式升级
1.理论意义:活跃用户应该被降低在相似度公式中的贡献度
每个用户对相似度的贡献不一样,活跃用户的贡献度降低
2.理论意义:用户在不同时间对item的操作应给予时间衰减惩罚