一、安装
nagios下载http://download.chinaunix.net/download.php?id=25308&ResourceID=7183
tar fvxz nagios-3.2.0.tar.gz
cd nagios-3.2.0
注:默认使用nagios用户,如果使用别的用户,必须在这里指定
useradd nagios
make all
make install
makeinstall-init
make install-comandmode
makeinstall-config
makeinstall-webconf
vim /etc/httpd/conf/httpd.conf
User nagios
Group nagios
service httpd restart
由于nagios的web控制台必须使用用户验证登陆,所以
htpasswd -c /usr/local/nagios/etc/htpasswd.users nagios
vim /usr/local/nagios/etc/cgi.cfg
在所有的nagiosadmin后面添加nagios
service nagios start
但此时的nagios监控到的localhost居然是down状态
原因是nagios是通过/usr/local/nagios/libexec下的各种插件来获取主机信息的,而此时此路径下没有安装任何的插件
tar fvxz /tmp/nagios-plugins-1.4.13.tar
cd nagios-plugins-1.4.13
./configure--prefix=/usr/local/nagios/
make
make install
再访问:http://localhost/nagios就会发现localhost是up状态了
二、配置
/usr/local/nagios/etc/nagios.cfg是nagios的主配置文件,通过配置此文件指定各个单独配置文件的路径使得其生效
cfg_file=/usr/local/nagios//etc/objects/commands.cfg(用什么监控?)
cfg_file=/usr/local/nagios//etc/objects/contacts.cfg(有问题联系谁?)
cfg_file=/usr/local/nagios//etc/objects/timeperiods.cfg(什么时间监控?默认即可)
cfg_file=/usr/local/nagios//etc/objects/localhost.cfg(监控谁?包括主机和服务两种)
为了方便管理,我们需要在此文件中为每一个被监控的主机单独指定一个配置文件
cfg_file=/usr/local/nagios//etc/objects/10.8.8.140.cfg
cfg_file=/usr/local/nagios//etc/objects/10.8.8.142.cfg
注:关于10.8.8.140.cfg的书写,请参考附件中的脚本
注:commands.cfg文件中
USER1代表/usr/local/nagios/libexec
$HOSTADDRESS$是系统自带的变量,自动调用localhost.cfg文件中定义的主机define host区域中的 address
$ARG1$是用户自定义的变量,需要在localhost.cfg文件中的check_command后添加!变量值
localhost.cfg中的check_command调用的就是commands.cfg中的command_name。command_name调用/usr/local/nagios/libexec中的check_*
但是,此时的nagios还只能监控本机,不能够监控远程主机。
如果要监控远程主机,需要配合使用nrpe。
原理:nagios服务端通过check_nrpe -H 被监控的IP -c "command"把"command"命令传送给被监控端也就是nrpe服务端,nrpe服务端接收到命令后查找主配置文件nrpe.cfg中command["command"]匹配"command",然后去执行对应的本地插件,把执行结果返回给 nagios服务端
注:nrpr的服务端是安装在被监控主机的,可以理解为nrpe是一个木马程序
被监控端安装nrpe
tar fvxz nrpe-2.12.tar.gz
cd nrpe-2.12
./configure --prefix=/usr/local/nagios2 --with-nrpe-user=apache --with-nrpe-group=apache --with-nagios-user=apache --with-nagios-group=apache
make all
make install-daemon
make install-daemon-config
make install-xinetd
make all
echo "nrpe 5666/tcp" >> /etc/services
tar fvxz /home/yuchunyun/libexec.tgz -C /usr/local/nagios(把nagios服务端的插件拷贝过来)
注:nrpe服务有两种启动方式。1:依赖于xinetd服务。2:单独配置文件方式启动。
方式1:请确保xinetd服务已安装
sed -i s/127.0.0.1/10.8.8.141/g /etc/xinetd.d/nrpe
/etc/init.d/xinetd restart
netstat -nutlp | grep xinetd
会发现nrpe开启的的默认5666端口是以xinetd核心守护进程方式启动
方式2:
/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
ps -ef | grep nrpe
会发现nrpe是一个单独的进程
日志
tail -f /usr/local/nagios/var/nagios.log
检查错误
/usr/local/nagios/bin/nagios -v/usr/local/nagios/etc/nagios.cfg
Nagios的check_*插件是用过返回值来判断的
0 成功 1 警告 2 严重错误 3 未知
三、自动化添加被监控主机
先执行host.sh,再执行service.sh
附件中有!
四、常见错误
解决:原因是命令执行的超时时间有限制
1.vi commands.cfg ---> command_line /usr/local/nagios/libexec/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ -t 60 (默认命令后面加:-t 60)
2.vi nrpe.cfg ---> command_timeout=603. 使用命令测试。---> ./check_nrpe -H 192.168.1.203 -c check_raid -t 30 (使用命令时后面加:-t 30)
注意:-t 后面的时间*添加。
本文出自 “月满轩尼诗” 博客,请务必保留此出处http://sunnyyu.blog.51cto.com/8745931/1384371