1. 推荐系统分类
(1)按照数据源分
基于人口统计学的推荐:主要依赖用户信息来分
基于内容(CB)的推荐:主要依赖被推荐物品的信息来分
基于协同过滤(CF)的推荐:基于近邻或基于模型;CF一上来的时候没有任何数据,所以需要结合一些获取推荐数据的方法
混合推荐:加权混合,切换混合,分区混合,分层混合
(2)基于近邻的协同过滤
基于用户(User-CF):可以利用其他用户的评价,找到与待分析用户相似评价的其他用户
基于物品(Item-CF):找获得相似用户评价的其他物品,避免CB仅依赖物品而造成的干扰
2. 推荐系统实验方法
(1)离线实验
在训练集训练,测试集测试准确率;整个过程中都在已经获得的数据上进行
优势:方便
劣势:可靠性不能保证
(2)用户调查
找真实用户来完成任务,回答问题,再做分析
(3)在线实验
AB测试:把用户分成两组,导到两套推荐系统,最后对比评测两套系统的优劣
3. 推荐准确度评测
(1)评分预测
计算 均方根误差 或 平均绝对误差
(2)TOP-N推荐
精确率(precision):所有被检索到的item中,应该被检索的所占比例
召回率(recall):正确检索的item占所有应该被正确检索的item的比例