当前位置: 首页 > news >正文

Linux Core Dump 分析

当程序运行的过程中异常终止或崩溃,操作系统会将程序当时的内存状态记录下来,保存在一个文件中,这种行为就叫做Core Dump(中文有的翻译成“核心转储”)。我们可以认为 core dump 是“内存快照”,但实际上,除了内存信息之外,还有些关键的程序运行状态也会同时 dump 下来,例如寄存器信息(包括程序指针、栈指针等)、内存管理信息、其他处理器和操作系统状态和信息。core dump 对于编程人员诊断和调试程序是非常有帮助的,因为对于有些程序错误是很难重现的,例如指针异常,而 core dump 文件可以再现程序出错时的情景。

1. Core Dump 名词解释

在半导体作为电脑内存材料之前,电脑内存使用的是磁芯内存 (Magnetic Core Memory),Core Dump 中的 Core 沿用了磁芯内存的Core表达。图为磁芯内存的一个单元。

APUE一书中作者有句话这样写的:

Because the file is namedcore, it shows how long this feature has been part of the Unix System.

这里的 core 就是沿用的是早期电脑磁芯内存中的表达,也能看出 Unix 系统 Core Dump 机制的悠久历史。

Dump指的是拷贝一种存储介质中的部分内容到另一个存储介质,或者将内容打印、显示或者其它输出设备。dump 出来的内容是格式化的,可以使用一些工具来解析它。

现代操作系统中,用Core Dump表示当程序异常终止或崩溃时,将进程此时的内存中的内容拷贝到磁盘文件中存储,以方便编程人员调试。

2. Core Dump 如何产生

上面说当程序运行过程中异常终止崩溃时会发生 core dump,但还没说到什么具体的情景程序会发生异常终止或崩溃,例如我们使用kill -9命令杀死一个进程会发生 core dump 吗?实验证明是不能的,那么什么情况会产生呢?

Linux 中信号是一种异步事件处理的机制,每种信号对应有其默认的操作,你可以在这里查看 Linux 系统提供的信号以及默认处理。默认操作主要包括忽略该信号 (Ingore)、暂停进程 (Stop)、终止进程 (Terminate)、终止并发生 core dump (core) 等。如果我们信号均是采用默认操作,那么,以下列出几种信号,它们在发生时会产生 core dump:

SignalActionComment
SIGQUITCoreQuit from keyboard
SIGILLCoreIllegal Instruction
SIGABRTCoreAbort signal from abort
SIGSEGVCoreInvalid memory reference
SIGTRAPCoreTrace/breakpoint trap

当然不仅限于上面的几种信号。这就是为什么我们使用Ctrl+z来挂起一个进程或者Ctrl+C结束一个进程均不会产生 core dump,因为前者会向进程发出SIGTSTP信号,该信号的默认操作为暂停进程 (Stop Process);后者会向进程发出SIGINT信号,该信号默认操作为终止进程 (Terminate Process)。同样上面提到的kill -9命令会发出SIGKILL命令,该命令默认为终止进程。而如果我们使用Ctrl+\来终止一个进程,会向进程发出SIGQUIT信号,默认是会产生 core dump 的。还有其它情景会产生 core dump,如:程序调用abort()函数、访存错误、非法指令等等。

下面举两个例子来说明:

终端下比较Ctrl+CCtrl+\

~$ sleep 10 #使用sleep命令休眠 10 s ^C #使用 Ctrl+C 终止该程序,不会产生 core dump ~$ sleep 10 ^\Quit (core dumped) #使用 Ctrl+\ 退出程序,会产生 core dump ~$ ls #多出下面一个 core 文件 -rw------- 1 guohailin guohailin 335872 10月 22 11:31 sleep.core.21990

小程序产生 core dump

#include <stdio.h> int main() { int *null_ptr = NULL; *null_ptr = 10; //对空指针指向的内存区域写,会发生段错误 return 0; }
#编译执行 ~$ ./a.out Segmentation fault (core dumped) ~$ ls #多出下面一个 core 文件 -rw------- 1 guohailin guohailin 200704 10月 22 11:35 a.out.core.22070

3. Linux 下打开 Core Dump

我使用的 Linux 发行版是 Ubuntu 13.04,设置生成 core dump 文件的方法如下:

3.1. 打开 core dump 功能

  • 在终端中输入命令ulimit -c,输出的结果为 0,说明默认是关闭 core dump 的,即当程序异常终止时,也不会生成 core dump 文件。
  • 我们可以使用命令ulimit -c unlimited来开启 core dump 功能,并且不限制 core dump 文件的大小; 如果需要限制文件的大小,将 unlimited 改成你想生成 core 文件最大的大小,注意单位为 blocks (KB)。
  • 用上面命令只会对当前的终端环境有效,如果想需要永久生效,可以修改文件/etc/security/limits.conf文件,关于此文件的设置参看这里。增加一行:
# /etc/security/limits.conf # #Each line describes a limit for a user in the form: # #<domain> <type> <item> <value> * soft core unlimited

3.2.修改 core 文件保存的路径

  • 默认生成的 core 文件保存在可执行文件所在的目录下,文件名就为core
  • 通过修改/proc/sys/kernel/core_uses_pid文件可以让生成 core 文件名是否自动加上 pid 号。
    例如echo 1 > /proc/sys/kernel/core_uses_pid,生成的 core 文件名将会变成core.pid,其中 pid 表示该进程的 PID。
  • 还可以通过修改/proc/sys/kernel/core_pattern来控制生成 core 文件保存的位置以及文件名格式。
    例如可以用echo "/tmp/corefile-%e-%p-%t" > /proc/sys/kernel/core_pattern设置生成的 core 文件保存在 “/tmp/corefile” 目录下,文件名格式为 “core-命令名-pid-时间戳”。这里有更多详细的说明!

4. 使用 gdb 调试 Core 文件

产生了 core 文件,我们该如何使用该 Core 文件进行调试呢?Linux 中可以使用 GDB 来调试 core 文件,步骤如下:

  • 首先,使用 gcc 编译源文件,加上-g以增加调试信息;
  • 按照上面打开 core dump 以使程序异常终止时能生成 core 文件;
  • 运行程序,当 core dump 之后,使用命令gdb program core来查看 core 文件,其中 program 为可执行程序名,core 为生成的 core 文件名。

下面用一个简单的例子来说明:

#include <stdio.h> int func(int *p) { int y = *p; return y; } int main() { int *p = NULL; return func(p); }

编译加上调试信息,运行之后core dump,使用 gdb 查看 core 文件。

~$ gcc core_demo.c -o core_demo -g ~$ ./core_demo Segmentation fault (core dumped) ~$ gdb core_demo core_demo.core.24816 ... Core was generated by './core_demo'. Program terminated with signal 11, Segmentation fault. #0 0x080483cd in func (p=0x0) at core_demo.c:5 5 int y = *p; (gdb) where #0 0x080483cd in func (p=0x0) at core_demo.c:5 #1 0x080483ef in main () at core_demo.c:12 (gdb) info frame Stack level 0, frame at 0xffd590a4: eip = 0x80483cd in func (core_demo.c:5); saved eip 0x80483ef called by frame at 0xffd590c0 source language c. Arglist at 0xffd5909c, args: p=0x0 Locals at 0xffd5909c, Previous frame's sp is 0xffd590a4 Saved registers: ebp at 0xffd5909c, eip at 0xffd590a0 (gdb)

从上面可以看出,我们可以还原 core_demo 执行时的场景,并使用where可以查看当前程序调用函数栈帧,还可以使用 gdb 中的命令查看寄存器,变量等信息。

http://www.jsqmd.com/news/772377/

相关文章:

  • DeFlowSLAM 基于自监督场景运动分解的动态稠密 SLAM
  • Linux时间编程避坑指南:localtime线程安全问题与localtime_r的正确使用姿势
  • Unity点云数据处理完整实战指南:Pcx插件高效工作流解析
  • 从CPU到密码学:聊聊逻辑门(AND/OR/XOR)在真实项目里的那些“神操作”
  • 送你一份价值10W的非专业的面试技巧
  • ASUS Tinker Edge R开发板:边缘AI计算的硬件解析与实践
  • Windows Batch (.bat) 脚本语法详解:从入门到实战
  • 软件生命周期基本过程支持过程组织过程
  • BepInEx终极指南:5分钟学会安装和使用开源游戏插件框架
  • ConvNeXt 系列改进:无缝兼容下游:ConvNeXt + FPN 构建特征金字塔,直接用于实例分割
  • 探秘iPaaS:企业数字化转型的关键利器
  • Open Event Attendee Android数据库设计:Room持久化与本地缓存策略
  • snarkjs入门指南:从零开始构建你的第一个零知识证明电路
  • 2026年深圳办公室装修公司专业排名——八匹马装饰领跑行业 - GrowthUME
  • 缓存经典问题:缓存穿透和缓存雪崩
  • d2s-editor:暗黑破坏神2存档修改完整指南与终极教程
  • 告别卡顿!深度解析Snapd服务:为什么它会悄悄吃光你的CPU和磁盘
  • 月活3.45亿却零收入,豆包收费是无奈之举还是破局之路?
  • 2026数据科学技术趋势全解析:新兴领域与高效学习路径指南
  • 别再对PyTorch标量tensor用for循环了!一个.item()方法就能搞定
  • 如何在手机上高效完成Android内核刷入:终极完整指南
  • 全域数学公理体系:基于π本源的九层套娃宇宙演化模型
  • 为 Claude Code 配置 Taotoken 作为后端大模型服务
  • 负载均衡有哪些?
  • SAM2VideoX:基于目标跟踪的结构保持视频生成技术
  • Unlock-Music:打破音乐平台枷锁,让你的音乐真正属于你
  • 终极AIdea测试驱动开发指南:从零构建高质量Flutter应用
  • python系列【仅供参考】:JSON和JSON5的区别
  • 从零开始:全志F1C200S Melis2.0 SDK环境搭建与第一个Hello World应用实战
  • 2026年匠心独运:探访本地木把手加工厂的秘密 - GrowthUME