【Elasticsearch】实用BM25 -第1部分: shard 如何影响Elasticsearch中的相关性评分

【Elasticsearch】实用BM25 -第1部分: shard 如何影响Elasticsearch中的相关性评分

1.概述

翻译:https://www.elastic.co/cn/blog/practical-bm25-part-1-how-shards-affect-relevance-scoring-in-elasticsearch

这是三部分实用BM25系列中关于相似度排名(相关性)的第一个帖子。下一篇文章链接在底部。

背景

在Elasticsearch 5.0中,我们将Okapi BM25作为默认的相似度算法,这是用于对与查询相关的结果进行评分的算法。我不会在这篇博客中过多地介绍BM25与其他方法的对比,但如果你想了解BM25的理论论证,你可以跳转到Elastic{on} 2016的BM25解神秘化演示。相反,我将为您介绍BM25的实际用法,包括可用的参数和影响评分的因素。

请记住,这个博客主要是为文本文档评分的。也就是说,它真正专注于帮助我们的搜索用户。如果您正在为日志或指标建立索引,并返回按某个明确的元数据/数字顺序(如时间戳)排序的结果,那么这个博客主要是为了满足您的好奇心。

理解sh

上一篇:一种通用整形数组压缩方法


下一篇:laravel使用Elasticsearch