随着solr版本的不断升级, 差异越来越大, 从以前的 solr1.2 到现在的 solr4.3, 无论是类还是功能都有很大的变换, 为了能及时跟上新版本的步伐, 在此将新版本的使用做一个简单的入门说明:
Solr3.6版本
SolrServer实例化类型有httpClient,和本地化,如果Solr服务器不在本地就用httpClient,在本地就用EmbeddedSolrServer
SolrServer可以操作索引,包括更新删除查询等操作
以下是httpClient实例化方式,需要tomcat运行Solr服务
1、ConcurrentUpdateSolrServer实例化SolrServer,该类实例化多用于更新删除索引操作
ConcurrentUpdateSolrServer(String solrServerUrl, int queueSize, int threadCount)
|
solrServerUrl是Solr服务器的地址,
|
queueSize缓冲区大小
|
threadCount 后台线程数
|
2、HttpSolrServer 实例化SolrServer,该类实例化多用于查询操作
HttpSolrServer(String baseURL)
|
baseURL是Solr的服务器地址
3、LBHttpSolrServer实例化SolrServer,用于有多个Solr服务器,负载均衡
LBHttpSolrServer(String... solrServerUrls)
|
solrServerUrls是多个Solr的服务器地址,用,号分隔
以下是本地实例化,即项目包含Solr服务,不需要tomcat运行Solr服务
EmbeddedSolrServer
private
static
CoreContainer.Initializer initializer =
null
;
private
static
CoreContainer coreContainer =
null
;
private
static
EmbeddedSolrServer server =
null
;
static
{
try
{
initializer =
new
CoreContainer.Initializer();
coreContainer = initializer.initialize();
server =
new
EmbeddedSolrServer(coreContainer,
""
);
}
catch
(Exception e) {
e.printStackTrace();
}
}
Solr搜索分页
1、SolrQuery类,此类有个方法setStart(10),当设置为10时,表示从第11记录取,默认取值为0,就是从第,1条开始
2、setRows(10),表示取出的记录数,默认就是10条
SolrQuery query = new SolrQuery("url_content:百色学院");
query.setStart(10);
query.setRows(10);
1、SolrQuery类,此类有个方法setHighlight(true),当设置为true时,表示开启了高亮
2、高亮设置,添加html,和设置高亮的Field
// 以下给两个字段开启了高亮,分别是name,description,
query.addHighlightField("name");
query.addHighlightField("description");
// 以下两个方法主要是在高亮的关键字前后加上html代码
query.setHighlightSimplePre("");
query.setHighlightSimplePost("");
3、获取高亮内容
Map>> map = response.getHighlighting();
Map的Key为document的Id,即你在schema.xml中设置的Id,Value为该Id对应的document的值,请听下面分 解,Value也为一个Map,该Map的Key为fieldName,Value为List,这个List里面的内容该文 档的高亮字段。
所以当做逻辑处理的时候,只要按照这个层次,依次把东西给取出来即可,如果取出来的东西为空,则用QueryResponse中的SolrDocument的getFieldValue(filedName)的值。
HttpSolrServer
HttpSolrServer使用HTTPClient 和solr服务器进行通信。
String url = http://localhost:8080/solr;
SolrServer server = new HttpSolrServer(url);
HttpSolrServer 是线程安全的,建议重复使用HttpSolrServer 实例。
HttpSorlrServer 允许设置链接属性
String url = "http://localhost:8080/solr";
HttpSolrServer server = new HttpSolrServer( url );
server.setSoTimeout(1000); // socket read timeout
server.setConnectionTimeout(100);
server.setDefaultMaxConnectionsPerHost(100);
server.setMaxTotalConnections(100);
server.setFollowRedirects(false); // defaults to false
// allowCompression defaults to false.
// Server side must support gzip or deflate for this to have any effect. s
erver.setAllowCompression(true);
server.setMaxRetries(1); // defaults to 0. > 1 not recommended.
EmbeddedSolrServer
EmbeddedSorrServer提供和HttpSorlrServer相同的接口,它不需要http连接
//注意,下面的属性也是可以在jvm参数里面设置的
System.setProperty("solr.solr.home", "/home/shalinsmangar/work/oss/branch-1.3/example/solr");
CoreContainer.Initializer initializer = new CoreContainer.Initializer();
CoreContainer coreContainer = initializer.initialize();
EmbeddedSolrServer server = new EmbeddedSolrServer(coreContainer, "");
如果你想要使用 Multicore 特性,那么你可以这样使用:
File home = new File( getSolrHome() );
File f = new File( home, "solr.xml" );
multicore.load( getSolrHome(), f );
EmbeddedSolrServer server = new EmbeddedSolrServer( multicore, "core name as defined in solr.xml" );
如果你在你的项目中内嵌solr服务,这将是一个不错的选择。无论你能否使用http,它都提供相同的接口
用法
solrj 被设计成一个可扩展的框架,用以向solr服务器提交请求,并接收回应。
我们已经将最通用的一些命令封装在了solrServer类中了。
Adding Data to Solr添加DOC到Solr索引
首先需要获得一个server的实例,
SolrServer server = getSolrServer();
如果,你使用的是一个远程的solrServer的话呢,你或许会这样来实现getSolrServer()这个方法:
public SolrServer getSolrServer(){ return new HttpSolrServer(url); }
如果,你使用的是一个本地的solrServer的话,你或许会这样来实现getSolrServer()方法:
public SolrServer getSolrServer(){ //the instance can be reused return new EmbeddedSolrServer(); }
如果,你在添加数据之前,想清空现有的索引,那么你可以这么做:
server.deleteByQuery( "*:*" );// delete everything!
构造一个document
SolrInputDocument doc1 = new SolrInputDocument();
doc1.addField( "id", "id1", 1.0f );
doc1.addField( "name", "doc1", 1.0f );
doc1.addField( "price", 10 );
构造另外一个文档,每个文档都能够被独自地提交给solr,但是,批量提交是更高效的。每一个对SolrServer的请求都是http请求,当然对于EmbeddedSolrServer来说,是不一样的。
SolrInputDocument doc2 = new SolrInputDocument();
doc2.addField( "id", "id2", 1.0f );
doc2.addField( "name", "doc2", 1.0f );
doc2.addField( "price", 20 );
构造一个文档的集合
Collection docs = new ArrayList();
docs.add( doc1 );
docs.add( doc2 );
将documents提交给solr
server.add( docs );
提交一个commit
server.commit();
在添加完documents后,立即做一个commit,你可以这样来写你的程序:
UpdateRequest req = new UpdateRequest();
req.setAction( UpdateRequest.ACTION.COMMIT, false, false );
req.add( docs );
UpdateResponse rsp = req.process( server );
Directly adding POJOs to Solr
使用 java 注释创建java bean。@Field ,可以被用在域上,或者是setter方法上。如果一个域的名称跟bean的名称是不一样的,那么在java注释中填写别名,具体的,可以参照下面的域categories
import org.apache.solr.client.solrj.beans.Field;
public class Item {
@Field
String id;
@Field("cat")
String[] categories;
@Field
List features;
}
java注释也可以使用在setter方法上,如下面的例子:
@Field("cat")
public void setCategory(String[] c){
this.categories = c;
}
创建bean实例
Item item = new Item();
item.id = "one";
item.categories = new String[] { "aaa", "bbb", "ccc" };
添加给Solr
server.addBean(item);
将多个bean提交给solr
List beans ;
//add Item objects to the list
server.addBeans(beans);
注意: 你可以重复使用SolrServer,这样可以提高性能。
Reading Data from Solr搜索
获取solrserver的实例
SolrServer server = getSolrServer();
构造 SolrQuery
SolrQuery query = new SolrQuery();
query.setQuery( "*:*" );
query.addSortField( "price", SolrQuery.ORDER.asc );
向服务器发出查询请求
QueryResponse rsp = server.query( query );
获取结果。
SolrDocumentList docs = rsp.getResults();
想要以javabean的方式获取结果,那么这个javabean必须像之前的例子一样有java注释
List beans = rsp.getBeans(Item.class);
高级用法
solrJ 提供了一组API,来帮助我们创建查询,下面是一个faceted query的例子。
SolrServer server = getSolrServer();
SolrQuery solrQuery = new SolrQuery().
setQuery("ipod").
setFacet(true).
setFacetMinCount(1).
setFacetLimit(8).
addFacetField("category").
addFacetField("inStock");
QueryResponse rsp = server.query(solrQuery);
所有的 setter/add 方法都是返回它自己本身的实例,所以就像你所看到的一样,上面的用法是链式的
Solr3.6版本
SolrServer实例化类型有httpClient,和本地化,如果Solr服务器不在本地就用httpClient,在本地就用EmbeddedSolrServer
SolrServer可以操作索引,包括更新删除查询等操作
以下是httpClient实例化方式,需要tomcat运行Solr服务
1、ConcurrentUpdateSolrServer实例化SolrServer,该类实例化多用于更新删除索引操作
ConcurrentUpdateSolrServer(String solrServerUrl, int queueSize, int threadCount)
solrServerUrl是Solr服务器的地址,
queueSize缓冲区大小
threadCount 后台线程数
2、HttpSolrServer 实例化SolrServer,该类实例化多用于查询操作
HttpSolrServer(String baseURL)
baseURL是Solr的服务器地址
3、LBHttpSolrServer实例化SolrServer,用于有多个Solr服务器,负载均衡
LBHttpSolrServer(String... solrServerUrls)
solrServerUrls是多个Solr的服务器地址,用,号分隔
以下是本地实例化,即项目包含Solr服务,不需要tomcat运行Solr服务
EmbeddedSolrServer
private static CoreContainer.Initializer initializer = null;
private static CoreContainer coreContainer = null;
private static EmbeddedSolrServer server = null;
static {
try {
System.setProperty("solr.solr.home", "D://test//solrcore//core0");
initializer = new CoreContainer.Initializer();
coreContainer = initializer.initialize();
server = new EmbeddedSolrServer(coreContainer, "");
} catch (Exception e) {
e.printStackTrace();
}
}