机器学习与推荐系统

1. 推荐系统分类

(1)按照数据源分

基于人口统计学的推荐:主要依赖用户信息来分

基于内容(CB)的推荐:主要依赖被推荐物品的信息来分

基于协同过滤(CF)的推荐:基于近邻或基于模型;CF一上来的时候没有任何数据,所以需要结合一些获取推荐数据的方法

混合推荐:加权混合,切换混合,分区混合,分层混合

(2)基于近邻的协同过滤

基于用户(User-CF):可以利用其他用户的评价,找到与待分析用户相似评价的其他用户

基于物品(Item-CF):找获得相似用户评价的其他物品,避免CB仅依赖物品而造成的干扰

 

2. 推荐系统实验方法

(1)离线实验

在训练集训练,测试集测试准确率;整个过程中都在已经获得的数据上进行

优势:方便

劣势:可靠性不能保证

(2)用户调查

找真实用户来完成任务,回答问题,再做分析

(3)在线实验

AB测试:把用户分成两组,导到两套推荐系统,最后对比评测两套系统的优劣

 

3. 推荐准确度评测

(1)评分预测

计算 均方根误差 或 平均绝对误差

(2)TOP-N推荐

精确率(precision):所有被检索到的item中,应该被检索的所占比例

召回率(recall):正确检索的item占所有应该被正确检索的item的比例

上一篇:CF #749


下一篇:推荐系统笔记