Linux监控数据回溯
网络服务监控
应用场景:
lvs 后端内网端机器网络波动监控;
nginx 80、443端口连接监控;
mysql 连接监控
以上为抛砖引玉,根据环境安装到监控工具(open falcon、zabbix、nagios)不同,自定义监控项。想要更精确地网络波动手动ping 将数据输出保存到文件。如以下:
ping xxx.xxx.xxx.xxx | awk ‘{ print $0” “ strftime(“%Y-%m-%d %H:%M:%S”,systime()) } ‘ >> /tmp/ping.log &
保存输出文件需要crontab定时删除。这样做到了网络服务是否波动的数据回溯方便自己回溯
system系统监控
atop = top + 监控数据回溯
官方网址
安装后,机器安装后,将有以下工具
atop
atopacctd atop附带守护进程使得atop正常输出日志
atopconvert atop日志文件转换指定版本
atopsar atop的sar,生成报告,查看回溯数据
常用命令
atop
g, 通用输出
m, 展示与内存有关的输出
d, 展示与硬盘使用有关的输出
c, 展示每个进程是由哪个命令行启动的
p, 展示进程相关的活动信息
C, 按照 CPU 使用排序
M, 按照内存使用排序
P, 按下后,即可输入正则表达式来搜索对应进程
t, 向前一个采样间隔,在分析 atop 日志时使用
T, 向后一个采样间隔,在分析 atop 日志时使用
v, 输出更详细的进程信息(ppid, user/group, date/time)
atopsar
atopsar -R -b hh:mm -e hh:mm -r logfile
生成cpu使用情况报告
atopsar -c 60 5
配置文件
atop/atop.daily
根据机器情况,自定义数据采集时长以及日志保留时间
LOGOPTS="-R" # default options
LOGINTERVAL=1000 # default interval in seconds
LOGGENERATIONS=28 # default number of days
Dont forget configure the config file !!!
systemctl restart atop
总结
中文引擎搜索只有基本atop用法拾人牙慧,各个博客都是copy来copy去,真正想要了解深入的推荐去atop工具官网认真查看了解下。呼吁大家github.com给开发者点颗星星!
个人生产环境配置项为: 1分钟采样,保留7天数据