(一)系统环境描述
本文档基于RHEL6u5 系统安装,配置为2节点高可用集群,节点为两台VMware虚拟机。
也可参考http://blog.51cto.com/ty1992/1325327
(二)RHEL6-HA集群安装前准备
1、节点本地hosts解析配置
在各集群节点上配置本地hosts,添加节点信息。
2、配置本地yum安装源
在集群各节点上配置本地yum安装源。
3、关闭系统防火墙、SELinux及NetworkManager服务
在集群各节点上关闭系统防火墙服务,关闭NetworkManager服务,关闭SELinux。
(三)RHEL6-HA集群程序组件安装及启动
1、集群主程序组件安装
在集群各节点上执行yum命令安装高可用组件。
yum groupinstall “High Availability”
2、集群管理程序组件安装
在集群各节点上执行yum命令安装高可用管理工具组件。
3、启动集群管理程序服务
若为rhel5,则首先初始化,设置用户及密码
/usr/sbin/luci_admin init
Service luci restart
使用 admin/888888登陆
在集群各节点上启动ricci服务。
修改集群各节点ricci用户密码。
在其中一个节点上启动luci服务。
命令显示可以通过此节点的url地址也网页方式访问集群管理工具。
(四)RHEL6-HA集群配置
1、登录集群配置管理工具
使用浏览器访问上述启动luci服务的集群配置管理工具页面,使用root用户及密码登录配置管理工具。
首次登录,会弹出以下警告信息,点击OK完成登录。
2、创建集群
点击左侧边栏“Manage Clusters”进入集群管理配置,再次点击“Create”创建集群。
填写节点与其他信息,并点击“Create Cluster”创建集群。
其中“Cluster Name”为集群名称;“Node Name”为集群节点名称,需要和节点hosts文件中保持一致,“Password”为节点ricci用户的密码,其他保持默认。
页面自动跳转并提示正在创建集群,创建完成后显示如下信息。
3、添加节点Fence设备
点击“Fence Devices”并点击“Add”添加设备。
在设备列表中选择“VMware Fencing (SOAP Interface)”。点击“Submit”提交。
其中“Name”为设备名称,IP地址为VMware虚拟化环境中的vCenter系统IP地址,“Login”为登录vCenter的用户,“Password”为相应vCenter用户的密码。
建议在vCenter系统中单独创建一个作为集群Fence设备的用户,并使该用户对集群各节点的虚拟机具有开机、关机、重启等基本权限。
查找虚拟机UUID信息。
使用fence_vmware_soap命令来查找相应集群节点虚拟机的UUID信息。
命令显示该用户有权查看的所有虚拟机的UUID信息。
点击“Nodes”并点击template1-hb节点进入Fence设备关联配置。
点击“Add Fence Method”添加对应Fence设备。
其中“VM name”为虚拟机名称,“VM UUID”为虚拟机的UUID信息,勾选“Use SSL”,点击“Submit”提交。
点击“Nodes”并点击template2-hb节点进入Fence设备关联配置。按照上述步骤为第二个节点关联Fence设备。
4、创建故障切换域
点击“Failover Domains”进入故障切换域配置,点击“Add”创建。
配置信息后点击“Create”创建。
其中“Name”为故障切换域名称,两个节点的优先级设为1和10,数字越小表示优先级越高。
5、集群资源创建
点击“Resources”并点击“Add”增加资源。
在资源下拉列表中选择。依次按需要创建IP地址、文件系统、应用脚本三个集群资源。
IP地址资源:
文件系统资源:
脚本资源:
三个资源创建完成。
6、服务创建
点击“Service Groups”并点击“Add”增加服务。集群保护的服务由若干个集群资源组成,并属于一个故障切换域,该服务可以在此故障切换域中的节点上切换。
定义相关信息后点击“Add Resource”添加资源。
在服务中,包含三个资源:IP、Filesystem、Script;这三个资源具备一定的依赖关系,在集群配置中可以用Clild Resource的方式指定这种依赖关系,常用的依赖关系是:
IP -> Filesystem -> Script
服务启动的时候,会先启动IP,然后挂载文件系统,最后用脚本启动服务,反之亦然。
在资源列表中先选择IP地址资源;
然后点击“Add Child Resource”添加一个子资源,也就是文件系统资源;再点击“Add Child Resource” 添加最后一个资源,也就是脚本资源。资源添加完毕,点击“Submit”提交。
资源添加完毕,集群保护的“App”服务正常启动。集群配置完成。
(五)集群管理常用命令
1、查看集群状态
执行命令clustat可以查看当前集群状态。
Member Name显示集群节点名,此集群有两个节点。
Status表示集群节点的状态,Online表示集群节点是正常在线状态。
Service Name表示集群资源服务名,此处显示集群资源服务名称为App。
Owner表示集群资源服务运行在哪个节点上,此处显示App运行在template1-hb节点上。
State表示集群资源服务运行状态,此处显示集群资源服务是已启动状态。
2、关闭集群中的资源组
clusvcadm -d App命令表示关闭集群资源服务App。意味着App服务所包含的浮动IP、文件系统、程序脚本都将停止。
3、启动集群中的资源组
clusvcadm -e App命令表示启动集群服务App。意味着App服务所包含的浮动IP、文件系统、程序脚本都将依次启动。
4、集群资源组切换
clusvcadm -r App命令表示手动将集群资源服务App从当前节点切换到另一个节点上。
5、离线集群节点
如果要对集群中的某台服务器进行硬件维护或停机,可以先将集群服务在该服务器上停止,然后对该服务器关机或维护。如果资源正运行在该服务器上,那么资源将自动切换到另外一台服务器上,如果该服务器没有运行资源,那么该操作对于集群中的资源没有影响。
执行service rgmanager stop 命令关闭资源组服务。
执行service cman stop 命令关闭集群服务。
命令执行完毕后,使用clustat命令显示集群状态,该节点应显示为“offline”。
6、上线集群节点
执行service cman start 命令启动集群服务。
执行service rgmanager start 命令启动资源组服务。
命令执行完毕后,使用clustat命令显示集群状态,该节点应显示为“online”。