《推荐系统:技术、评估及高效算法》一1.7 推荐系统是个交叉学科领域

本节书摘来自华章出版社《推荐系统:技术、评估及高效算法》一书中的第1章,第1.7节,作者 [ 美]弗朗西斯科·里奇(Francesco Ricci)利奥·罗卡奇(Lior Rokach)布拉哈·夏皮拉(Bracha Shapira)保罗 B.坎特(Paul B.Kantor),更多章节内容可以访问云栖社区“华章计算机”公众号查看

1.7 推荐系统是个交叉学科领域

设计和开发推荐系统是多个学科共同努力的结果,这得益于多个计算机科学领域的成果,特别是机器学习、数据挖掘、信息检索和人机交互。这在本书章节中和上述讨论可以明显地看出来。在此,简要地梳理一下这些关系。
机器学习和数据挖掘,是人工智能的子领域,它们是让计算机学习示例、数据或过去的经验从而使其执行某些任务时性能最佳[109]。例如,购买“Da Vinci Code”的顾客也买了“The Five People You Meet in Heaven”,数据挖掘就可以利用这类交易数据进行学习。因此,可以用这种相互关联信息构建推荐系统。

为了预测用户对物品的评价,或者为了学习如何修正推荐列表排序,许多推荐系统以利用各种机器学习和数据挖掘算法为中心。本书第2章对上下文推荐系统预处理方法使用到的数据挖掘技术做了总述,例如,抽样或降维;分类技术,如贝叶斯网络和支持向量机的方法;聚类技术,如k-means算法;关联规则。

其他例证推荐系统和数据挖掘关系的章节是:第12章讨论了利用主动学习获取信息;第5章建立预测评分模型的最优化技术;第7章介绍利用上下文数据提供了各类预测评分模型;第24章介绍数据挖掘技术,利用多准则的物品评价标准,更好地预测用户综合评价;第25章重点讲了数据挖掘的推荐系统攻击检测方法,建立健壮性算法的解决方案;第4章阐述目前基于学习的协同过滤系统的很多实例;第19章阐述了复合矩阵或超边(用户、资源、标签)的超图的数据挖掘解决方法;第20章介绍数据挖掘的信任网络解决方法。
信息检索(IR)的目的是帮助用户存储和检索各种不同形式的内容,如文本、图像、视频[63]。利用信息检索工具,用户可以很快找到自己需要的有关的信息和全面的信息。虽然IR并不始于Web,但由于Web搜索引擎的发展,万维网在开创这一新观念方面扮演了重要的角色。

信息检索和推荐系统都面临着过滤和排序问题。IR一般重点发展全局检索技术,通常忽略个体需要和用户偏好。而[25]声称,推荐系统还没有明显地与信息检索分离。推荐系统和信息检索或搜索引擎最核心的区别是“考虑个体”与“用户感兴趣和对用户有用”,而推荐系统正尝试在这方面取得成功。
目前,现代的Web搜索引擎已经依赖推荐技术来解决Web搜索的挑战,实现更先进的搜索功能。例如,搜索引擎给用户查询推荐相似查询。各种搜索引擎也试图通过产生用户查询结果实现个性化,返回的结果不仅根据用户查询条件还要参考用户上下文(例如,他的位置)和他的检索历史。

第18章讨论了IR的研究目标,涉及从推荐系统角度实现Web检索个性化。作者阐述了如何应用推荐系统技术解决搜索引擎面临的挑战。该章的重点是改进搜索引擎的两个有希望实现的想法:个性化和协同。该章描述了利用用户偏好和上下文信息影响搜索结果的一系列不同的方法,去实现个性化Web搜索。另外,该章讨论了协同信息检索方面目前要做的工作,协同信息检索尝试利用潜在的合作关系(朋友间、同事间或者有相似需求的用户间)实现一系列的信息检索任务。这种新型的研究叫作社交检索,得益于社交网络中的特性,检索结果受用户偏好和用户经验影响。作者预见“推荐系统和检索系统的汇聚”,并且相信在搜索引擎算法上这些资源的整合可以产生用户的高满意度,让用户能在正确的时间收到正确的信息。

跟IR研究相关同时又阐述这方面研究的是:第19章针对上下文标签的检索问题;第3章介绍了根植于当前搜索引擎技术的基于上下文方法的概述。

最后,推荐系统最终目标是给用户提供有用的信息,因此,在推荐最终能否被接受这个问题上,人机交互起了重大作用。实际上,许多领域的研究清楚地表明,从用户角度来看,HCI中与系统可用性相关的方面对用户是否愿意使用推荐系统以及为了更有效的推荐结果而提供主动的输入有巨大的影响。这些问题在1.6节讨论过。

上一篇:textarea自动增高并隐藏滚动条


下一篇:专访 ShineScrum公司创始人Jim Wang(王军):组织架构会发生颠覆性的变化,自治团队和团队单元会成为主体