lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)

lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)

免费的源码demo   http://download.csdn.net/detail/yjflinchong/4291818

analyzers :  各种分词器 以国家、语言、功能进行分类
http://download.csdn.net/detail/yjflinchong/4291723
http://download.csdn.net/detail/yjflinchong/4291717

grouping : 分组统计 ,可以对各Field进行几个级别的搜索结果中field值的统计 http://download.csdn.net/detail/yjflinchong/4517079

highlighter : 高亮,搜索结果Document中的空间向量文本进行高性能高亮 http://download.csdn.net/detail/yjflinchong/4291735

icu:  开始不知道它是干嘛呢,既然有分词的实现咋不放入 analyzers包中呢,详细的看后,http://site.icu-project.org/ 发现它的定义。提供标准国际化编码UTF-8支持。 实用价值不大。

instantiated : 好像是 实时搜索有关,从包名称中推里其内容为搜索对象初始化相关

join: 连接时查询, 看事例代码,主要突出  父类 、及子类 query 和 同时包含 2者的查询,支持相互之间的查询时进行查询

memory: 内存相关。只有一个类:MemoryIndex,实现序列化, 官方介绍:高性能单文档主内存的全文检索和索引。 实现简单在内存中索引、存储索引、查询、算法计算等,针对小数据量,但要求快速索引的可以选择  http://download.csdn.net/detail/yjflinchong/4291738

misc:其他相关项

pruning : 英文单词的google 翻译是修剪, 是的,pruning是用来缩减lucene索引大小的。在readme中 官方使用Static index pruning tools. 静态索引修剪工具来描述。在大索引的企业索引中也是蛮有用处的。

queries: 解析 + || @ 等操作符 封装为query 和 相反的从query到查询公式字符串

queryparser: 高一层的在搜索逻辑上封装 Query 

remote: 远程搜索,使用java RMI技术,没多大实用价值

spatial: geo地图中位置范围查询,基于将坐标转换为数值型进行范围查询,还有这模块将会在4.0中做较大更新,做geo搜索的创业型公司来说,这是件非常棒的事情

spellchecker: 提升了性能和准确率。 这就是类google 搜索时,提示相关关键词功能的实现

lucene3.5以上版本jar包模块的用处(分词+分组+高亮+搜索提示)



      本文转自yjflinchong 51CTO博客,原文链接:      本文转自yjflinchong 51CTO博客,原文链接:,如需转载请自行联系原作者
,如需转载请自行联系原作者




上一篇:dom4j解析xml方法


下一篇:mytop安装,使用mytop监控MySQL性能