集成分词器
集成IK中文分词器
ES的安装参见博文------------《Elastic Search入门》
- 下载IK分词器,选择对应版本的zip压缩版。这里以elasticsearch-analysis-ik-7.6.0.zip为例。
- 将zip压缩包上传到服务器(/home/monk/Download/elasticsearch-analysis-ik-7.6.0.zip),解压到ES的插件目录(/apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-ik-7.6.0),如图所示:
unzip /home/monk/Download/elasticsearch-analysis-ik-7.6.0.zip -d /apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-ik-7.6.0/
- 重启ES即可
集成拼音分词器
-
下载拼音分词器,选择对应版本的zip压缩版。这里以elasticsearch-analysis-pinyin-7.6.0.zip为例
-
将zip压缩包上传到服务器(/home/monk/Download/elasticsearch-analysis-pinyin-7.6.0.zip),解压到ES的插件目录(/apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-ik-7.6.0),如图所示:
unzip /home/monk/Download/elasticsearch-analysis-pinyin-7.6.0.zip -d /apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-pinyin-7.6.0/
-
重启ES即可
验证是否集成成功
- 默认分词器效果
- IK分词器效果
- ik_max_word: 会将文本做最细粒度的拆分,比如会将“*国歌”拆分为“*,中华人民,中华,华人,人民*,人民,人,民,*,共和,和,国国,国歌”,会穷尽各种可能的组合,适合 Term Query;
- ik_smart: 会做最粗粒度的拆分,比如会将“*国歌”拆分为“*,国歌”,适合 Phrase 查询。
- 拼音分词器效果