OGG 报OGG-01221错误

昨天正准备下班,zabbix 监控预警,报ogg 投递进程abort,马上连到生产库查看,果然进程挂掉,手动启动进程依然挂掉,执行view report 查看到如下报错:

2021-02-02 18:59:26 WARNING OGG-01221 Connect failed to 10.178.4.13:7819, error 111:Connection refused.

2021-02-02 18:59:36 WARNING OGG-01221 Connect failed to 10.178.4.13:7819, error 111:Connection refused.

2021-02-02 18:59:46 WARNING OGG-01221 Connect failed to 10.178.4.13:7819, error 111:Connection refused.

2021-02-02 18:59:56 WARNING OGG-01221 Connect failed to 10.178.4.13:7819, error 111:Connection refused.

2021-02-02 19:00:06 WARNING OGG-01221 Connect failed to 10.178.4.13:7819, error 111:Connection refused.

2021-02-02 19:00:16 WARNING OGG-01221 Connect failed to 10.178.4.13:7819, error 111:Connection refused.

ogg环境正常运行半年时间了,第一时间怀疑网络不通,咨询网络同事有无对网络做调整,答曰没有调整网络,查看主机防火墙都是关闭状态,telnet 目的端ip端口能正常连接,重新启动源端、目的端ogg 进程故障依旧,ogg 投递进程还是挂掉,抽取与应用进程正常运行,网上查询资料大多说是网络不通,我的环境网络是正常的,进一步分析故障原因。

进入到ogg 安装目录查看,发现ggserr.log 属主、组变成了root:root,其他文件都是oracle:oinstall,立即修正权限,重新启动ogg 投递进程,正常运行,观察一段时间,队列也消耗掉了,故障恢复,百思不得其解。

-rw-r----- 1 oracle oinstall 10492780 Jan 5 15:00 ggserr.log.1
drwxr-x--- 2 oracle oinstall 4096 Feb 2 19:36 dirprm
drwxr-x--- 2 oracle oinstall 4096 Feb 2 19:37 dirdmp
drwxr-x--- 2 oracle oinstall 4096 Feb 2 19:38 dirpcs
drwxr-x--- 2 oracle oinstall 12288 Feb 2 19:38 dirrpt
drwxr-x--- 2 oracle oinstall 6 Feb 2 19:38 dirtmp
-rw-r----- 1 oracle oinstall 7003264 Feb 2 20:03 ggserr.log

查询mos资料 ,经过分析找到原因:

ogg12.3之后会自动在ggserr.log到达10M时归档该文件(ggserr.log.n),而这时如果有日志写入(比如执行info all),会自动创建一个新的文件。

由于ogg监控用的是root用户执行info all,就会有概率导致新的文件变成root权限,导致投递进程挂掉,故调整ogg监控脚本执行用户为oracle,避免后续发生同样的故障。

上一篇:python怎么和SQL连接上


下一篇:通过 OInstall 工具只安装 Word/Excel/PPT 程序