如何查找并简单分析core文件

当系统发生coredump时,通常需要通过分析core文件来定位问题所在,但实际工作中,有时却发现core 文件找不到,或者core文件被删除了。

一、core文件没有生成

KINGBASE core 文件通常是在 $KINGBASE_DATA目录下。可以使用 coredumpctl list 查找core 文件是否生成 (对于abrtd 服务生成的coredump不会列出):

[kingbase@dbhost03 ~]$ coredumpctl list
No coredumps found.

core文件没有生成的原因主要有存储空间不够、目录没有权限、limit设置太小。可以通过ulimit -c 查看limit限制大小。

[root@dbhost03 security]# ulimit -c
unlimited

如果要修改limit,可以修改/etc/security/limits.conf 文件,如:

* soft core unlimited
* hard core unlimited

RedHat7 是通过abrtd服务生成core,如果没有发现core,可以先确认下abrtd 服务是否启动。

二、core 文件被截断原因

1、limit 设置太小

关注两个标红的。这两个值设置过小,可能导致文件被截断。

如何查找并简单分析core文件
[kingbase@dbhost03 tns]$ ulimit -a
core file size          (blocks, -c) unlimited
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 18501
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) 4096
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited
如何查找并简单分析core文件

2、修改/etc/systemd/coredump.conf

coredump.conf 文件显示的都是注释掉默认值。

如何查找并简单分析core文件
[Coredump]
#Storage=external
#Compress=yes
#ProcessSizeMax=2G
#ExternalSizeMax=2G
#JournalSizeMax=767M
#MaxUse=
#KeepFree=
如何查找并简单分析core文件
ExternalSizeMax=2G 表示dump 文件最大2G。
修改后需要执行: systemctl daemon-reload

三、Redhat7 core文件

core 文件有两种方式:abrt or coredump,可以通过以下命令查看:

[root@dbhost03 systemd]# sysctl -n kernel.core_pattern
|/usr/libexec/abrt-hook-ccpp %s %c %p %u %g %t e %P %I %h

Redhat7 使用abrtd (automatically bug report daemon )服务,core 文件会在/var/spool/abrt/ccpp* 目录下。默认非root用户生成core会被系统自动删除,在messages 日志文件中通常有如下信息:

如何查找并简单分析core文件
Jul 24 15:50:22 dbhost03 abrt-hook-ccpp: Process 5070 (kingbase) of user 1001 killed by SIGSEGV - dumping core
Jul 24 15:50:25 dbhost03 abrt-server: Executable '/opt/Kingbase/ES/V8/Server/bin/kingbase' doesn't belong to any package and ProcessUnpackaged is set to 'no'
Jul 24 15:50:25 dbhost03 abrt-server: 'post-create' on '/var/spool/abrt/ccpp-2021-07-24-15:50:22-5070' exited with 1
Jul 24 15:50:25 dbhost03 abrt-server: Deleting problem directory '/var/spool/abrt/ccpp-2021-07-24-15:50:22-5070'
如何查找并简单分析core文件

要保留core 不被删除,需要修改 /etc/abrt/abrt-action-save-package-data.conf  文件,并重启abrtd服务。

OpenGPGCheck = no
ProcessUnpackaged = yes  

ProcessUnpackaged = yes , 我们自己写的可执行程序,一般就是拷过去的,不从属于任何的package(rpm),abrt不生效。为了保证core文件大小,同时还要修改 /etc/abrt/abrt.conf 

# Max size for crash storage [MiB] or 0 for unlimited
#
MaxCrashReportsSize = 1000

三、如何简单分析core文件

1、确认core文件是哪个程序生成的

如何查找并简单分析core文件

2、使用gdb分析core文件

如何查找并简单分析core文件

上一篇:ECS使用体验的文章


下一篇:【Linux】Linux ulimit使用