教你快速从SQL过度到Elasticsearch的DSL查询

前言

Elasticsearch太强大了,强大到跟python一样,一种查询能好几种语法。
其实我们用到的可能只是其中的一部分,比如:全文搜索。
我们一般是会将mysql的部分字段导入到es,再查询出相应的ID,再根据这些ID去数据库找出来。

问题来了:数据导入到es后,很多人都要面对这个es的json查询语法,也叫DSL,如下
教你快速从SQL过度到Elasticsearch的DSL查询

于是一堆新词来了,比如:filter、match、multi_match、query、term、range,容易让没学过的人抵触。

如果正常开发业务的程序员,只关心原先怎么用sql查询出来的数据,在es中查询出来。
sql查询定位,一般常用的是:=、!=、>、<、and、or、in、between等等。

举个例子,原先sql查询一商品是这样的

SELECT * FROM goods WHERE spu_id = "wp123" OR ( spu_id = "wp345" AND min_price = 30 ) 

对应到es是

{
	"query": {
		"bool": {
			"should": [{
					"term": {
						"spu_id": "wp123"
					}
				},
				{
					"bool": {
						"must": [{
								"term": {
									"spu_id": "wp345"
								}
							},
							{
								"term": {
									"min_price": 30
								}
							}
						]
					}
				}
			]
		}
	}
}

sql和dsl是有一定对应关系的,下面把一些常用的总结下,让不熟悉es能丝滑从sql过度

以下内容由chenqionghe倾情提供,祝你es使用愉快

bool-相当于一个括号

用bool包含起来的{},相当用()包含了一个复合查询语句,如上边的

{
	"bool": {
		"must": [{
				"term": {
					"spu_id": "wp345"
				}
			},
			{
				"term": {
					"min_price": 30
				}
			}
		]
	}
}

相当于
教你快速从SQL过度到Elasticsearch的DSL查询
看到没有就是这么简单

should-相当于or

教你快速从SQL过度到Elasticsearch的DSL查询

must-相当于and

教你快速从SQL过度到Elasticsearch的DSL查询

must_not-相当于 ! and

这个就相当于and取反了,

例如:

SELECT  *  FROM goods WHERE !(shop_id =79)

相当于

  "query": {
    "bool": {
      "must_not": [
        {
          "term": {"shop_id": "79"}
        }
      ]
    }
  }
}

term-相当于=

例如

SELECT * FROM goods WHERE shop_id =79

相当于

{
  "query": {
    "bool": {
      "must": [
        {
          "term": {"shop_id": "79"}
        }
      ]
    }
  }
}

terms-相当于in

例如

SELECT * FROM goods WHERE shop_id in (79,80,81)

相当于

{
  "query": {
    "bool": {
      "must": [
        {
          "terms": {"shop_id": [79,80,81]}
        }
      ]
    }
  }
}

range-相当于between

例如

SELECT * FROM goods WHERE id between 1000 and 10005

相当于

{
	"query": {
		"bool": {
			"must": [{
				"range": {
					"id": {
						"gte": 1000,
						"lte": 10005
					}
				}
			}]
		}
	}
}

exist相当于is not null

例如

SELECT * FROM goods WHERE id is not null

相当于

{
	"query": {
		"bool": {
			"must_not": [{
				"exists": {
					"field": "id"
				}
			}]
		}
	}
}

match-类似match...AGAINST

这个match就相当于mysql的全文索引,关于mysql的全文索引,可以看一下这篇文章:从零开始学习MySQL全文索引

举个查询的例子,我要搜索包含 "海南 2018"的词,如下
{
	"query": {
		"match": {
			"name": "海南 2018"
		}
	}
}

这相当于把所有的“海南”和“2018”记录找出来了,他们是一个or的关系。如果想同时匹配怎么办呢?
可以这样,指定一个operator,默认是用的"or",可以改成这样

{
	"query": {
		"match": {
			"name": {
				"query": "海南 2018",
				"operator": "and"
			}
		}
	}
}

includes-相当于select

比如

SELECT id,name FROM goods WHERE id = 1765

相当于

{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "id": 1765
          }
        }
      ]
    }
  },
  "_source":{"includes":["id","name"]}
}

到这里,差不多就已经可以丝滑地从sql过度到es的dsl了

一些常见问题

match和term的区别

match在匹配时会对所查找的关键词进行分词,然后按分词匹配查找,而term会直接对关键词进行查找。一般模糊查找的时候,多用match

query和filter

filter:只查询出搜索条件的数据,不计算相关度分数
query:查询出搜索条件的数据,并计算相关度分数,按照分数进行倒序排序
filter比query性能好,两者可以一起使用

filtered和filter区别

filtered是比较老的的版本的语法。现在目前已经被bool替代。推荐使用bool。
老版本写法

{
	"query": {
		"filtered": {
			"query": {
				"match": {
					"text": "quick brown fox"
				}
			},
			"filter": {
				"term": {
					"status": "published"
				}
			}
		}
	}
}

新版本写法

{
	"query": {
		"bool": {
			"must": {
				"match": {
					"text": "quick brown fox"
				}
			},
			"filter": {
				"term": {
					"status": "published"
				}
			}
		}
	}
}

filter两种用法
嵌套在bool下

{
	"query": {
		"bool": {
			"must": {
				"term": {
					"term": {
						"title": "kitchen3"
					}
				}
			},
			"filter": {
				"term": {
					"price": 1000
				}
			}
		}
	}
}

在根目录下使用

{
	"query": {
		"term": {
			"title": "kitchen3"
		}
	},
	"filter": {
		"term": {
			"price": 1000
		}
	}
}

term和terms的区别

term相当于where =
terms相当于 where in (xx,xx,xx)
如果想要=于多次,得用多个term,而不是terms

还有一些内容,没来得及写,如order by、group by等等会陆续在这篇文章更新...

教你快速从SQL过度到Elasticsearch的DSL查询

上一篇:读书笔记:提高C++性能的编程技术


下一篇:c++设计模式系列----builder模式