[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

为了更好的排版, 所以将IK分词器的安装重启了一篇博文,  大家可以接上solr的安装一同查看.
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例一: http://www.cnblogs.com/wang-meng/p/5814798.html

8, 打开浏览器查看solr可视化界面
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

到了这里solr就配置好了, 可是我们的IK 分词器还没有配置呢, 如果不配IK分词器的话 它是怎样分词的呢? 我们就来先看一下: 
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

每个字都分成了一个词, 这当然不是我们想要的结果, 接下来我们就开始配置IK 分词器.

9, 使用IK分词器
复制IK分词器的jar包到/tomcat/webapp/solr/WEB-INF/lib(这里是solr/WEB-INF下)
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

lk.cfg.xml 和stopword.dic 复制到tomcat/webapp/WEB-INF/classes下(默认没有classes目录, 需自己手动创建)
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

10, 配置IK分词器
配置solr家中的schema.xml文件, 包括配置数据类型及自定义的字段
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

编辑schema.xml, 由于这个文件有1000多行, 所以我们改用notepad++ 来打开(这个软件相信大家都不陌生)
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

找到schema.xml并打开修改: 
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.
修改如下:
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

重启tomcat然后继续去solr可视化界面查看: 
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

再来看现在的分词是不是好多了呢? 当然有了IK分词器还是不够的, 往往我们还需要配置自己的扩展词和停词来满足我们的需求.

11, 配置扩展词和停词
首先看下配置文件:
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

使用vim编辑IKAnalyzer.cfg.xml:
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

添加ext.dic文件, 然后在ext.dic文件中添加扩展词:
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

同理, 添加停词可以在stopwork.dic直接添加.
到了这里IK分词器也配置好了. 哎, 从头来还是搞了一上午, 不过又重新操作一遍, 对这些又更加熟练了.

上一篇:Opencv读取视频一闪而过情况分析


下一篇:Android高效加载大图、多图解决方案,有效避免程序内存溢出现象