作为一个运维,需要会使用监控系统查看服务器状态以及网站流量指标,利用监控系统的数据去了解上线发布的结果,和网站的健康状态。
利用一个优秀的监控软件,我们可以:
●通过一个友好的界面进行浏览整个网站所有的服务器状态
●可以在 Web 前端方便的查看监控数据
●可以回溯寻找事故发生时系统的问题和报警情况
zabbix简介
●zabbix 是一个基于 Web 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。
●zabbix 能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。
●zabbix 由 2 部分构成,zabbix server 与可选组件 zabbix agent。通过 C/S 模式(客户端、服务器模式)采集数据,通过 B/S 模式(浏览器、服务器模式)在 Web 端展示和配置。
●zabbix server 可以通过 SNMP(简单的网络管理协议),zabbix agent(代理端、监控端),ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在 Linux 等平台上。
●zabbix agent 需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU 等信息的收集。
zabbix 监控原理
zabbix agent安装在被监控的主机上,zabbix agent负责定期收集客户端本地各项数据,并发送至 zabbix server 端,zabbix server 收到数据后,将数据存储到数据库中,用户基于 Zabbix WEB 可以看到数据在前端展现图像。当 zabbix 监控某个具体的项目, 该项目会设置一个触发器阈值,当被监控的指标超过该触发器设定的阈值,会进行一些必要的动作,动作包括:发送信息(邮件、微信、短信)、发送命令(shell 命令、reboot、restart、install 等)。
zabbix 监控部署在系统中,包含常见的五个程序: zabbix_server、zabbix_agent、zabbix_proxy、zabbix_get、zabbix_sender 等。
●zabbix server:zabbix 服务端守护进程,其中 zabbix_agent、zabbix_get、zabbix_sender、zabbix_proxy 的数据最终都提交给 zabbix server;
●zabbix agent:客户端守护进程,负责收集客户端数据,例如:收集 CPU 负载、内存、硬盘使用情况等;
●zabbix proxy:zabbix 分布式代理守护进程,通常大于 500 台主机,需要进行分布式监控架构部署,转发数据时可以减小跨区域产生的网络延迟
●zabbix get:zabbix 数据接收工具,单独使用的命令,主动获取数据,通常在 server 或者 proxy 端执行获取远程客户端信息的命令(常用于测试)
●zabbix sender:zabbix 数据发送工具,主动发送数据,用户发送数据给 server 或 proxy 端,通常用户耗时比较长的检查(常用于测试)
部署 zabbix 5.0服务端
##zabbix-server 内存至少 2G,推荐 4G;
systemctl disable --now firewalld
setenforce 0
hostnamectl set-hostname zbx-server
su -
获取 zabbix 的下载源进行yum安装的配置
rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
##更换 zabbix.repo 为阿里源
#主要将原来的源路径换成国内的阿里云,减小下载速度
cd /etc/yum.repos.d
mv bak/* ./ #如果使用的是本地源需要把之前移动的在线源数据移回来
sed -i 's#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' zabbix.repo #直接修改文件内容,将匹配的内容替换
yum clean all && yum makecache
yum install -y zabbix-server-mysql zabbix-agent
##安装SCL(Software Collections),便于后续安装高版本的 php,默认 yum 安装的 php 版本为 5.4,版本过低,zabbix 5.0 版本对 php 版本最低要 7.2.0 版本。SCL 可以使得在同一台机器上使用多个版本的软件,而又不会影响整个系统的依赖环境。软件包会安装在 /opt/rh 目录下。
yum install -y centos-release-scl
##修改 zabbix-front 前端源,安装 zabbix 前端环境到 scl 环境下
vim zabbix.repo
......
[zabbix-frontend]
......
enabled=1 #开启安装源
......
yum install -y zabbix-web-mysql-scl zabbix-apache-conf-scl
安装 zabbix 所需的数据库并且导入数据库信息
yum install -y mariadb-server mariadb
systemctl enable --now mariadb
mysql_secure_installation #初始化数据库,并设置密码,如123456,第一个为输入当前root密码,没有直接enter即可,后面是否设置新的root密码Y然后输入新的密码,重复输入密码,后面选项直接Y即可
mysql -u root -p123456 #登录数据库,添加数据库用户并授予权限
CREATE DATABASE zabbix character set utf8 collate utf8_bin;
GRANT all ON zabbix.* TO 'zabbix'@'%' IDENTIFIED BY '123456';
flush privileges;
#导入数据库信息
rpm -ql zabbix-server-mysql #查询sql文件的位置
zcat /usr/share/doc/zabbix-server-mysql-5.0.15/create.sql.gz | mysql -uroot -p123456 zabbix #zcat压缩状态下查看
修改 zabbix server 配置文件,修改数据库的密码
vim /etc/zabbix/zabbix_server.conf
......
DBPassword=123456 #124行,指定 zabbix 数据库的密码
修改 zabbix 的php配置文件
vim /etc/opt/rh/rh-php72/php-fpm.d/zabbix.conf
......
php_value[date.timezone] = Asia/Shanghai #24行,取消注释,修改时区
启动 zabbix 相关服务
systemctl restart zabbix-server zabbix-agent httpd rh-php72-php-fpm
systemctl enable zabbix-server zabbix-agent httpd rh-php72-php-fpm
wen页面访问zabbix服务
浏览器访问:http://192.168.150.5/zabbix
确保所有软件状态都OK,点击下一步,设置数据库的密码 123456
安装完成后,默认的登录账号和密码为:Admin/zabbix
设置文件界面:点击左边菜单栏的【User settings】,【Language】选择 Chinese(zh_CN),再点击 Update 更新。
##设置为中文后在主机的图形界面会出现不支持的乱码,需要解决 zabbix-server Web页面中文乱码问题
yum install -y wqy-microhei-fonts
\cp -f /usr/share/fonts/wqy-microhei/wqy-microhei.ttc /usr/share/fonts/dejavu/DejaVuSans.ttf #\cp不需要确认直接复制
部署 zabbix 客户端
zabbix 5.0 版本采用 golang 语言开发的新版本客户端 agent2 。
zabbix 服务端 zabbix_server 默认使用 10051 端口,客户端 zabbix_agent2 默认使用 10050 端口。
systemctl disable --now firewalld
setenforce 0
hostnamectl set-hostname zbx-agent01
su -
配置时间同步和时区保持一致
#服务端和客户端都配置时间同步
yum install -y ntpdate
ntpdate -u ntp.aliyun.com
#客户端配置时区,与服务器保持一致,实际运用中建议放到crontab计划性任务中
mv /etc/localtime{,.bak}
ln -s /usr/share/zoneinfo/Asia/Shanghai /etc/localtime
date
设置 zabbix 的下载源,安装 zabbix-agent2
rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
cd /etc/yum.repos.d
mv bak/* ./
sed -i 's#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo
yum install -y zabbix-agent2
修改 agent2 配置文件
vim /etc/zabbix/zabbix_agent2.conf
......
Server=192.168.150.5 #80行,指定 zabbix 服务端的 IP 地址
ServerActive=192.168.150.5 #120行,指定活跃的zabbix 服务端的 IP 地址
Hostname=zbx-agent01 #131行,指定当前 zabbix 客户端的主机名
#启动 zabbix-agent2
systemctl start zabbix-agent2
systemctl enable zabbix-agent2
netstat -natp | grep zabbix
在服务端验证 zabbix-agent2 的连通性
yum install -y zabbix-get #安装 zabbix 主动获取数据的命令
[root@zbx-server ~]# zabbix_get -s '192.168.150.10' -p 10050 -k 'agent.ping' #-k指定键,如果能ping通则返回1,代表连接成功
1
[root@zbx-server ~]# zabbix_get -s '192.168.150.10' -p 10050 -k 'system.hostname' #获取主机名
zbx-agent01
在Web 页面中添加 agent 主机
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】设置成 zbx-agent01
【可见的名称】设置成 zbx-agent01-192.168.150.10
【群组】选择 Linux server
【Interfaces】的【IP地址】设置成 192.168.150.10
再点击上方菜单栏【模板】
【Link new tamplates】搜索 Linux ,选择 Template OS Linux by Zabbix agent
点击 【添加】
自定义监控内容
案列:自定义监控客户端服务器登录的人数
需求:限制登录人数不超过 3 个,超过 3 个就发出报警信息
#在客户端创建自定义 key
1. 创建 zabbix 的监控项配置文件,用于自定义 key
vim /etc/zabbix/zabbix_agent2.conf
#--- 268行 ---可以将自定义的监控项配置文件创建在 zabbix_agent2.d 目录中
Include=/etc/zabbix/zabbix_agent2.d/*.conf
#--- 268行 ---自定义监控项的格式如下
# Format: UserParameter=<key>,<shell command>
cd /etc/zabbix/zabbix_agent2.d/
vim login.conf
UserParameter=login.user,who|wc -l
systemctl restart zabbix-agent2.service
3. 在服务端验证新建的监控项
[root@zbx-server ~]# zabbix_get -s '192.168.150.10' -p 10050 -k 'login.user'
2
4.在 Web 页面创建自定义监控项模板
创建模板
点击左边菜单栏【配置】中的【模板】,点击【创建模板】
【模板名称】设置成 Template Login User
【可见的名称】设置成 Template Login User
【群组】选择 Template
【描述】可自定义
点击 【添加】,此时就可在【链接的模板】中搜索到 Template Login User 了
创建应用集(用于管理监控项的)
点击上方菜单栏【应用集】,点击【创建应用集】
【名称】设置成 Login User
点击 【添加】
创建监控项
点击上方菜单栏【监控项】,点击【创建监控项】
【名称】设置成 Number of login users
【键值】设置成 login.user #键值必须要与自定义的监控项配置文件中设置的保持一致
【更新间隔】设置成 10s
【历史数据保留时长】Storage period30d #保留时间可自定义设置
点击 【添加】
创建触发器(当监控项获取到监控的值后和触发器预设的值进行对比,判断是否报警)
点击上方菜单栏【触发器】,点击【创建触发器】
【名称】设置成 Number of login users is greater than 3
【严重性】设置成 警告
【表达式】点击添加,【监控项】点击选择 Number of login users,【功能】选择 last(),【结果】选择 > 3,点击 【插入】
点击 【添加】