原文:Elasticsearch7.X 入门学习第八课笔记-----索引模板和动态模板
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。
本章,我们将简单介绍索引模板和动态模板的内容。其实,在前面章节,我们已经粗略地用到了动态模板,但是没有明确提出这样的概念。
索引模板Index Template
索引模板,英文名为Index Template。它是一种机制,这种机制允许我们定义一种模板,这种模板当新索引创建时将被自动应用。模板包含settings
和mapping
,以及这个模板是否可被应用于新的索引。
索引模板有以下限制:
- 索引模板仅在一个索引新创建时才起作用,修改模板不会影响已创建的索引。
- 可以设定多个索引模板,这些索引模板的设置将被
merge
在一起。 - 可以通过对索引模板指定
order
的数值,来控制merge
的过程。
模板定义可以如下:
-
{
-
"order": 0, // 模板优先级
-
"template": "sample_info*", // 模板匹配的名称方式
-
"settings": {...}, // 索引设置
-
"mappings": {...}, // 索引中各字段的映射定义
-
"aliases": {...} // 索引的别名
-
}
接下来,我们创建两个模板。
接下来,我们创建两个模板。
-
# 创建一个默认模板,模板名为 template_default
-
# 这个模板匹配所有的索引,它的order属性值为0。索引创建时将被设置一个分片,一个副本。
-
PUT _template/template_default
-
{
-
"index_patterns": ["*"],
-
"order" : 0,
-
"version": 1,
-
"settings": {
-
"number_of_shards": 1,
-
"number_of_replicas":1
-
}
-
}
-
-
# 创建一个模板,模板名为 template_test
-
# 这个模板匹配test开头的索引,它的order属性值为1。索引创建时将被设置一个分片,两个副本。
-
# 并且,date类型自动检测功能将关闭,数字自动检测功能将开启。
-
PUT /_template/template_test
-
{
-
"index_patterns" : ["test*"],
-
"order" : 1,
-
"settings" : {
-
"number_of_shards": 1,
-
"number_of_replicas" : 2
-
},
-
"mappings" : {
-
"date_detection": false,
-
"numeric_detection": true
-
}
-
}
-
-
# 删除模板名为template_1的模板
-
DELETE /_template/template_1
-
-
# 获取模板名为template_1的模板
-
GET /_template/template_1
-
-
# 获取通配符模板
-
GET /_template/temp*
-
-
# 获取多个模板
-
GET /_template/template_1,template_2
-
-
# 获取所有模板
-
GET /_template
-
-
# 判断模板是否存在
-
HEAD _template/template_1
1、模板优先级
有时候,一个模板可能绝大部分符合新建索引的需求,但是局部需要微调,此时,如果复制旧的模板,修改该模板后,成为一个新的索引模板即可达到我们的需求,但是这操作略显重复。此时,可以采用模板叠加与覆盖来操作。模板的优先级是通过模板中的 order 字段定义的,数字越大,优先级越高。
- 应用Elasticsearch默认的
settings
和mappings
。 - 应用 order 数值低的索引模板中的设置。
- 应用 order 数值高的索引模板中的设置
- 应用索引创建时,用户指定的
settings
和mappings
2、索引模板的匹配
索引模板中的 index_patterns字段定义的是该索引模板所应用的索引情况。如 "index_patterns" : ["test*"] 所表示的含义是,当新建索引时,所有以 tete 开头的索引都会自动匹配到该索引模板。利用该模板进行相应的设置和字段添加等。
3、setting 部分
索引模板中的 setting 部分一般定义的是索引的主分片、拷贝分片、刷新时间、自定义分析器等。常见的 setting 部分结构如下:
-
-
"settings": {
-
"index": {
-
"analysis": {...}, // 自定义的分析器
-
"number_of_shards": "32", // 主分片的个数
-
"number_of_replicas": "1", // 主分片的拷贝分片个数
-
"refresh_interval": "5s" // 刷新时间
-
}
-
}
-
建立的索引,不会立马查到,这是为什么 Elasticsearch 为 near-real-time(接近实时)的原因,需要配置刷新时间,默认的是 1s。setting 的设置中,重点是自定义分析器的设置。
分析器是三个顺序执行的组件的结合。他们分别是字符过滤器、分词器、标记过滤器。
动态模板
动态模板,英文名为Dynamic Templates,是根据Elasticsearch可识别的数据类型,结合字段名称,来动态设定字段类型的一种机制。
而Elasticsearch自带了动态字段映射,它的规则如下所示。
动态字段映射
通过动态模板这种机制,我们可以达到类似下面的效果:
- 所有的字符串类型都设定成
keyword
,或者关闭keyword
字段。 -
is
开头的字段都设置成boolean类型。 -
long_
开头的字段都设置成long类型。
它的语法如下所示:
动态模板的语法
这种语法包含以下内容:
- 动态模板是定义在某个具体索引的mappings中
- 动态模板需要指定一个名称,例如上图的
my_template_name
- 匹配规则是一个数组
- 为匹配到的字段设置
mapping
1. 例子1
-
DELETE my_index
-
# 简单的例子
-
PUT my_index
-
{
-
"mappings": {
-
"dynamic_templates": [
-
{
-
"strings_as_boolean": {
-
"match_mapping_type": "string",
-
"match":"is*",
-
"mapping": {
-
"type": "boolean"
-
}
-
}
-
},
-
{
-
"strings_as_keywords": {
-
"match_mapping_type": "string",
-
"mapping": {
-
"type": "keyword"
-
}
-
}
-
}
-
]
-
}
-
}
-
PUT my_index/_doc/1
-
{
-
"firstName":"Ruan",
-
"isVIP":"true"
-
}
-
GET my_index/_mapping
在这个例子中,我们设置了两个动态模板。
- 根据
strings_as_boolean
的动态模板定义,如果字段类型为字符串类型,且字段名以is
开头,其字段类型将映射成boolean类型。 - 根据
strings_as_keywords
的动态模板定义,如果字段类型为字符串类型,其字段类型将映射成keyword类型。
2. 例子2
-
DELETE my_index
-
# 路径的例子
-
PUT my_index
-
{
-
"mappings": {
-
"dynamic_templates": [
-
{
-
"full_name": {
-
"path_match": "name.*",
-
"path_unmatch": "*.middle",
-
"mapping": {
-
"type": "text",
-
"copy_to": "full_name"
-
}
-
}
-
}
-
]
-
}
-
}
-
-
-
PUT my_index/_doc/1
-
{
-
"name": {
-
"first": "John",
-
"middle": "Winston",
-
"last": "Lennon"
-
}
-
}
-
-
GET my_index/_search?q=full_name:John
在这个例子中,我们定义了一个动态模板,名字叫full_name
。它会匹配路径,路径以name
开头,且不以middle
结尾的字段,将被映射成一个text,且拷贝到full_name这个字段中。
总结
我们了解了索引模板和动态模板各自的作用,也举了一些实际的例子来加深我们的印象。但是,更全面的内容还需要看Elasticsearch的官网。