《数据挖掘:理论与算法》学习笔记(十)—推荐算法

推荐系统

《数据挖掘:理论与算法》学习笔记(十)—推荐算法
包括两种方式—基于内容的过滤和协同过滤
《数据挖掘:理论与算法》学习笔记(十)—推荐算法

隐含语义分析

Tf-idf
《数据挖掘:理论与算法》学习笔记(十)—推荐算法
TF—出现频率
IDF—在其他文档中出现的频率,(在其他文档也经常出现,则IDF值会比较低)

向量空间模型
《数据挖掘:理论与算法》学习笔记(十)—推荐算法
相似度—余弦距离
《数据挖掘:理论与算法》学习笔记(十)—推荐算法
存在的问题
《数据挖掘:理论与算法》学习笔记(十)—推荐算法
LSA—隐含语义分析
《数据挖掘:理论与算法》学习笔记(十)—推荐算法

PageRank

《数据挖掘:理论与算法》学习笔记(十)—推荐算法

L(pj)是指向其他人个数,d是参数,通常设为0.85

《数据挖掘:理论与算法》学习笔记(十)—推荐算法

协同过滤

《数据挖掘:理论与算法》学习笔记(十)—推荐算法

上一篇:NLP——天池新闻文本分类 Task1


下一篇:ESP8266+微信配网smartconfig,esp32可用