推荐系统。主要採用对历史数据的分析计算,得到某种模型,对未来的数据进行预測。说究竟。还是分类问题。
Mahout,是一个可扩展的机器学习库。可用于单机,也可用于Hadoop。
Mahout的API非常easy,实现一个推荐功能仅仅须要例如以下的几行代码:
<span style="font-size:18px;"> DataModel model = new FileDataModel(new File(file));//建立数据模型
UserSimilarity similarity = new PearsonCorrelationSimilarity(model);//计算皮尔逊类似度
UserNeighborhood neighborhood = new NearestNUserNeighborhood(25,
similarity, model);//计算N近邻用户
Recommender recommender = new GenericUserBasedRecommender(model,
neighborhood, similarity);//基于用户的推荐
list = recommender.recommend(userid, size);</span>
其数据格式也非常easy,仅仅须要例如以下格式的数据
<span style="font-size:14px;">userid, itemid, preference value</span>
即用户对产品的偏好数据的相应关系。
这是我用Mahout实现的简单的在线电影推荐系统:http://movierecommender.sinaapp.com/
使用了movielens-100k的数据集.
项目源代码在此:https://github.com/laozhaokun/movie_recommender
眼下速度还非常慢,不非常稳定。