一、集群机器配置信息
Cloudera集群机器:
10.2.45.104 GBD000.localdomain GBD000
10.2.45.105 GBD101.localdomain GBD101
10.2.45.106 GBD102.localdomain GBD102
10.2.45.107 GBD311.localdomain GBD311
10.2.45.108 GBD312.localdomain GBD312
10.2.45.109 GBD313.localdomain GBD313
10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315
其中10.2.45.105 GBD101.localdomain GBD101是namenode
Zookeeper集群机器:
10.2.45.105 GBD101.localdomain GBD101
10.2.45.106 GBD102.localdomain GBD102
10.2.45.107 GBD311.localdomain GBD311
Solr Server安装机器:
10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315
二、Solr安装配置
1、使用Cloudera Mamager,在以下机器上安装Solr Server。
10.2.45.125 GBD314.localdomain GBD314
10.2.45.126 GBD315.localdomain GBD315
在 HDFS 中创建 /solr 目录:(一般CM安装好Solr之后,在HDFS中已经创建了此目录)
$ sudo -u hdfs hadoop fs -mkdir /solr
$ sudo -u hdfs hadoop fs -chown solr /solr
2、编辑Solr配置文件
使用Parcels安装,Solr的配置文件位置为:
/opt/cloudera/parcels/CDH-5.7.0-1.cdh5.7.0.p0.45/etc/default/solr
修改Zookeeper的连接地址:
SOLR_ZK_ENSEMBLE=<GBD101>:,<GBD102>:,<GBD311>:/solr
修改HDFS的连接地址:
SOLR_HDFS_HOME=hdfs://GBD101.localdomain:8020/solr
设置 HDFS 配置文件目录:
SOLR_HDFS_CONFIG=/etc/hadoop/conf
3、创建Solr运行时配置
在任意一个节点上生成配置文件:
#solrctl instancedir --generate #HOME/solr_configs
solrctl instancedir --generate /usr/local/solr/collection1
/usr/local/solr是已经创建好的自定义目录,collection1为是配置文件生成目录,不需要提前创建,名称可以自定义。
创建collection1实例并将配置文件上传到Zookeeper:
#solrctl instancedir --create collection1 #HOME/solr_configs
solrctl instancedir --create collection1 /usr/local/solr/collection1
通过以下命令查看上传的Instance:
solrctl instancedir --list
配置文件上传到Zookeeper之后,其他节点就可以从上面下载配置文件。接下来创建collection:
solrctl collection --create collection1 -s -r
其中-s表示设置Shard数为2,-r表示设置的replica数为1
以上步骤之后,Solr的实例就算创建完毕,可以通过可以通过http://10.2.45.126:8983/solr/#/~cloud查看创建的Collection。
参考文档:
中文版本Cloudera Solr Cloud 配置: http://ae.yyuap.com/pages/viewpage.action?pageId=919744
Cloudera官网配置文档
http://www.cloudera.com/documentation/enterprise/latest/topics/search_deploy_search_solrcloud.html#csig_topic_4_5