Lucene5学习之WildcardQuery使用

     WildcardQuery即通配符查询,即使用通配符来模糊查询,常见的通配符有?,*,-等等,通配符不知道怎么使用的自己Google学习下吧。照例还是先阅读官方的API文档:

Lucene5学习之WildcardQuery使用
 特别要注意的Note后面的话,提醒我们注意,WildcardQuery查询是很慢的,因为它需要遍历很多的Term,为了避免极慢的查询速度,请不要使用以星号开头的通配符进行查询。

   除了官方给的那点提醒以外,我也要提醒大家一点,WildcardQuery对于用户输入的查询关键字是大小写敏感的,请不要使用大写形式,因为索引中的Term都是小写形式的,这个大家都知道的,特此提醒。

WildcardQuery构造函数除了需要一个Term对象以外,还有一个参数需要设置maxDeterminizedStates,源码注释里是这样解释的:

    

Java代码  Lucene5学习之WildcardQuery使用
  1. /** 
  2.    * Constructs a query for terms matching <code>term</code>. 
  3.    * @param maxDeterminizedStates maximum number of states in the resulting 
  4.    *   automata.  If the automata would need more than this many states 
  5.    *   TooComplextToDeterminizeException is thrown.  Higher number require more 
  6.    *   space but can process more complex automata. 
  7.    */  
  8.   public WildcardQuery(Term term, int maxDeterminizedStates) {  
  9.     super(term, toAutomaton(term), maxDeterminizedStates);  
  10.   }  

 其实就是设置根据通配符支持最大能支持有多少Term情况,Term越多占的硬盘空间越大,但查询也更精确。这个值默认源码里给定的是10000,默认即可。

其他也没什么好说的,WildcardQuery使用难度也不大,照样贴一个使用示例吧:

Java代码  Lucene5学习之WildcardQuery使用
  1. String directoryPath = "D:/lucenedir";  
  2. String fieldName = "contents";  
  3. String queryString = "*recursive*";   
  4.           
  5. Query query = new WildcardQuery(new Term(fieldName,queryString));  

 示例代码的意图就是查询索引文档中包含recursive这个单词的,OK,打完收工了,此时此刻2015-03-24 22:26,该睡觉了。预计接下来要说说的就是SpanQuery了。

 

如果你还有什么问题请加我Q-Q:7-3-6-0-3-1-3-0-5,

或者加裙
Lucene5学习之WildcardQuery使用一起交流学习!

转载:http://iamyida.iteye.com/blog/2195249

上一篇:Asp.Net MVC4入门指南(8):给数据模型添加校验器


下一篇:jQuery 使用