ceph cluster log 定位为记录 ceph 事件的日志,通常情况下,ceph -w
也能捞到跟默认日志 /var/log/ceph/ceph.log
一样的信息,如下图。
昨天出现一种异常的情况,就是 ceph 突然发了很多事件,导致这个日志文件突然暴增,一分钟能写好几个 G,仔细一看,原来这个日志等级默认是 debug
,因为我们部署的时候 ceph mon 是放在根分区下面,跟日志是一起的,如果这个日志突然暴增,很容易导致 mon 因为本地空间不足而挂掉,这样不管是 ceph -s
还是其他命令,全部都会因为 mon 挂掉而卡住。
最后实时更新一下 mon 的配置,来把记录的事件等级降低到 info
,这样可以有效抑制日志的增长,当然把这个 cluster log 移到专门的日志盘会是更好的选择。