zabbix学习小结

一、zabbix是干什么的?
    zabbix主要用来做监控。监控什么呢?比如日常巡检的CPU、内存、磁盘、swap交换分区和各端口进程等。
    以往日常巡检,通过df -h命令获得磁盘的使用量和剩余量、top命令获得cpu和内存的利用率等全手动方式巡检,到
    后来遇到一个叫shell的,一个shell脚本只需sh执行,便可以获得所有巡检的相关的信息。

shell脚本如下:

#!/bin/bash
CIPAN=`df -h |awk -F '' "NR==2{print }"|awk '{print $(NF-1)}' |tr -d %`
SWAP=`free -m |awk -F ' ' "NR==4{print}"|awk '{print $(NF-1)}' ` if [ $SWAP -eq 0 ];then
echo -e " "
else
SWAP=`free -m |awk -F '' "NR==4{print}"|awk '{print $(NF-1)/$(NF-2) *100} '|head -c 6 `
fi FREE=`free -m | grep cache: |awk '{print $3 }'`
TOTAL=`free -m | grep Mem: |awk '{print $2 }'`
#NEICUN=$(awk 'BEGIN{print ($FREE *100)/ $TOTAL }')
NEICUN=`awk 'BEGIN{print ( "'$FREE'"/"'$TOTAL'")*100}'|head -c 5`
US=`top -bn1 |grep Cpu|awk -F " " '{print $2}'|tr -d %us,`
SY=`top -bn1 |grep Cpu|awk -F " " '{print $3}'|tr -d %sy,`
LOAD=`top -bn1 |grep average|awk -F " " '{print $(NF-2),$(NF-1),$NF}'`
echo "磁盘剩余空间 交换空间 内存占用率 cpu_us cpu_sy 负载 网络环境" PING=`ping -c 1 IP &> /dev/null`
if [ $? -eq 0 ];then
echo "$CIPAN% / $SWAP $NEICUN $US $SY $LOAD 正常"
else
echo "$CIPAN% / $SWAP $NEICUN $US $SY $LOAD failed,需要检验"
fi
FANG=`curl -I -s IP:80/qykh |grep -E "200|302 "|wc -l`
if [ $FANG -eq 1 ];then
echo -e "业务正常访问,无需处理"
else
echo -e "你该检查服务了.."
fi if [ $CIPAN -gt 80];then
echo "系统磁盘空间占用过多,需要清理"
else
echo "系统磁盘空间还算正常... "
fi

二、zabbix初次监控
    1.首先在浏览器输入你的IP地址/zabbix/index.php 进入zabbix Web页面,然后点击主机,进入主机点击创建主机,然后只需填入主机名、可见名、群组、agent代理程序的接口
     输入完上述信息,点击save保存。
    
    2.创建完主机后,点击监控项,创建监控项,监控项需要填写监控项名称、类型(zabbix客户端和zabbix客户端(主动式)、键值(可以使用zabbix提供的键值和自己定义键值),
      ,然后点击添加即可创建。
      键值不知道什么意思可进入该网址查文档:http://blog.csdn.net/chuang3344/article/details/74081682 常用的键值应用尽有
    
     说明:监控项就是你要监控的目标,比如cpu等,名称自定义,通常要有意义,类型常用两种(zabbix客户端和zabbix客户端(主动式)),zabbix客户端默认是被动模式,
     什么是被动模式?被动模式就是zabbix中的server端主动去agent端取数据,这就叫被动模式。主动模式就是agent端主动将搜集到的数据给server端。两者agent.conf配置文件中的信息略有差别。
     主动模式可参考此网址学习:http://blog.csdn.net/lamyuqingcsdn/article/details/52512603
    
    3.创建触发器,触发器主要用处是:当监控项的监控条件超过监控标准就会报警,就会在前台的问题一栏活仪表盘显示。
      触发器的创建也很简单,主要要填写的名称、严重性(分类)、表达式(表达式就是监控项中定义的键值)、描述等。
    
    4.创建图形,创建图形要填写的如图形名称、监控项等。
    
    简单的监控就此创建完毕了。
    
    
    三、模板、应用集、动作
    
     模板:模板包括监控项、触发器、图形、自动发现等,有系统自带的模板和zabbix使用者自己创建的模板。通常生产环境更符合为了更符合实际情况,我们采取自定义模板,自己写一个模板,
     按照公司生产环境的规范。
    
     创建模板,和创建主机同理,填写模板名称、可见名称、群组、描述等。
    
     应用集:应用集的目的在于分类,比如cpu的所有监控项我们可以放到cpu的应用集中,disk所有的监控项放到disk的应用集中。
    
     动作:动作主要目的在于报警,当监控项超过触发器的限定条件时,就会触发一个动作,这个动作就是报警(邮件、短信报警等)
     邮件报警可参照此网址学习:https://www.cnblogs.com/zoulongbin/p/6420239.html
    
    四、zabbix中文官方文档(比较详细,初次学习可以做比较好的参考)
        网址为:https://www.zabbix.com/documentation/3.4/zh/manual/web_interface/frontend_sections/monitoring
        
    五、监控TCP连接数
        参考学习网址如下:http://blog.51cto.com/john88wang/1586234
    
    六、自动发现(主机自动发现)
       参考学习网址如下:http://www.jianshu.com/p/3cb9073ea6af

zabbix远远不止这些,还有更多的好东西等着探索

上一篇:开启mongod服务(Mongo运行错误:Failed to connect 127.0.0.1:27017,reason:errno:10061由于目标计算机积极拒绝,无法连接)


下一篇:Spark on Yarn运行错误:Yarn application has already ended! It might have been killed or unable to launch application master