应用反馈上午10点左右出现大量应用连接数据库报错
采集9点-10点和10点-11点的AWR报告进行分析
DB时间明显差异,再继续分析等待事件
可以看出有session相关的Latch等待事件,查看相关文档,跟并发数有关,而数据库中的表和索引的degree都是1,排除这个引发的因素
再继续分析监听日志
cat listener_0910.log |grep "HOST=13"|awk -F* '{print $1,$3}'>lis1.txt
cat lis1.txt |cut -b 12-23,53-65>lis2.txt
将lis2.txt中的数据插入到表中,进行分析
select to_char(to_date(t.lis_time,'dd:mi:ss'),'dd:mi:ss'),count(*) from lis2 t group by to_char(to_date(t.lis_time,'dd:mi:ss'),'dd:mi:ss') ;
可以发现这几个时间片有并发的session请求,经和应用确认,在该时间段有批量重启服务的操作