当前位置：首页 > news >正文

Linux 系统编程 05：进程控制

news 2026/7/1 0:31:18

前言：

承接上一篇进程创建与 fork 核心机制，本篇深入讲解进程生命周期的后半段：进程退出、资源回收、程序替换，以及面试高频的孤儿 / 僵尸进程问题。掌握这些内容，才能完整管控进程的全生命周期，写出稳定的多进程程序，同时也是排查进程泄漏、资源残留等工程问题的核心理论基础。

一、进程的退出方式

进程的退出分为正常退出和异常退出两大类，不同退出方式的清理行为不同，对系统资源的影响也有差异。

1. 正常退出的三种方式

正常退出是进程主动结束，按约定返回退出状态码，内核会有序释放资源。

main 函数 return 返回：main 函数执行结束 return，等价于调用 exit 函数，会自动执行清理工作。
调用 exit () 函数：C 标准库函数，执行完用户注册的清理函数、刷新所有缓冲区后，进入内核终止进程。
调用_exit () /_Exit () 函数：系统调用，直接进入内核终止进程，不执行用户层清理，不刷新缓冲区。

2. 异常退出的两种场景

异常退出是进程被外部事件强制终止，无法执行自身的收尾逻辑。

收到终止信号：如Ctrl+C触发的 SIGINT、kill 命令发送的 SIGKILL 等，进程被内核强制终止。
调用 abort () 函数：主动发送 SIGABRT 信号终止自己，属于异常退出，会触发核心转储。

3. exit 与_exit 的核心区别（面试高频）

这是进程退出最核心的考点，两者的本质差异在于是否执行用户态的清理工作：

对比维度	exit（库函数）	_exit（系统调用）
层级	C 标准库函数，用户态	系统调用，直接进入内核
缓冲区处理	刷新所有标准 IO 缓冲区，写入数据	不处理缓冲区，直接丢弃
终止处理函数	执行 atexit 注册的回调函数	不执行任何用户回调
清理程度	执行完整的用户态清理再进入内核	直接终止进程，只做内核级清理
头文件	`<stdlib.h>`	`<unistd.h>`

工程规范：普通业务逻辑退出统一用 exit；子进程 fork 后出错、需要立刻终止且不污染父进程缓冲区时，用_exit。

4. atexit 注册终止处理函数

#include <stdlib.h> int atexit(void (*function)(void));

功能：注册进程正常退出时自动执行的回调函数，支持注册多个，执行顺序与注册顺序相反。
限制：只有调用 exit 或 main 函数 return 时才会触发；_exit、信号终止、abort 均不会触发。

二、进程资源回收：wait 与 waitpid

子进程退出后，内核不会立刻释放全部资源，会保留 PCB 等少量信息，等待父进程读取退出状态。如果父进程不回收，子进程就会变成僵尸进程，占用系统资源。

1. 为什么必须回收子进程

子进程退出时，内核释放其内存、文件等大部分资源，但保留进程 PID、退出状态、运行时间等信息在 PCB 中，目的是让父进程获取子进程的结束情况。

父进程调用 wait/waitpid：内核清理残留 PCB，彻底释放资源
父进程不回收：子进程成为僵尸进程，PID 一直被占用，大量僵尸会耗尽系统 PID，无法创建新进程

2. wait 函数：阻塞回收任意子进程

#include <sys/types.h> #include <sys/wait.h> pid_t wait(int *wstatus);

功能：阻塞当前进程，直到任意一个子进程退出，回收其资源
参数wstatus：传出参数，保存子进程的退出状态信息，可通过宏解析具体状态
返回值：成功返回回收的子进程 PID；失败返回 - 1（如没有子进程）

3. waitpid 函数：灵活可控的回收

wait 只能阻塞等待任意子进程，waitpid 支持指定进程、非阻塞等待，是工程中更常用的版本。

pid_t waitpid(pid_t pid, int *wstatus, int options);

参数详解

pid：指定回收的目标
- > 0：回收指定 PID 的子进程
- -1：回收任意一个子进程，等价于 wait
- 0：回收和当前进程同组的任意子进程
options：控制选项，常用WNOHANG表示非阻塞，没有已退出的子进程则立刻返回 0
wstatus：同 wait，存储退出状态

4. 退出状态解析宏

wstatus不能直接当整数读取，必须通过系统提供的宏解析：

WIFEXITED(status)：子进程正常退出则为真
WEXITSTATUS(status)：获取子进程正常退出的返回码，仅 WIFEXITED 为真时有效
WIFSIGNALED(status)：子进程被信号终止则为真
WTERMSIG(status)：获取终止子进程的信号编号，仅 WIFSIGNALED 为真时有效

5. 实战：回收子进程并解析状态

#include <stdio.h> #include <unistd.h> #include <sys/wait.h> #include <stdlib.h> int main(void) { pid_t pid = fork(); if (pid == 0) { printf("子进程运行，PID=%d\n", getpid()); sleep(2); exit(66); // 子进程正常退出，返回码66 } // 父进程阻塞回收 int status; pid_t ret = wait(&status); if (ret == -1) { perror("wait failed"); return 1; } if (WIFEXITED(status)) { printf("子进程%d正常退出，退出码：%d\n", ret, WEXITSTATUS(status)); } else if (WIFSIGNALED(status)) { printf("子进程%d被信号终止，信号编号：%d\n", ret, WTERMSIG(status)); } return 0; }

三、exec 函数族：程序替换

fork 创建的子进程和父进程执行相同的代码，而实际开发中，子进程往往需要执行全新的独立程序，这就需要用到 exec 函数族完成程序替换。

1. exec 的本质

exec 不是创建新进程，而是用磁盘上的新可执行文件，替换当前进程的代码段、数据段、堆、栈等全部用户空间内容，进程的 PID 保持不变，相当于给进程 “换了灵魂”。

调用成功后，原进程中 exec 之后的所有代码都不会再执行，因为代码已经被替换
调用失败才会返回 - 1，继续执行后续代码

2. 六个函数的命名规律与分类

exec 一共有 6 个函数，后缀字母对应不同的传参和查找规则：

l（list）：参数以列表形式逐个传入，以 NULL 结尾
v（vector）：参数以指针数组形式传入
p（path）：自动在 PATH 环境变量中查找可执行文件
e（environment）：自定义传入环境变量数组

函数名	传参方式	查找路径	环境变量
execl	列表	需写完整路径	继承原进程
execlp	列表	自动搜 PATH	继承原进程
execle	列表	需写完整路径	自定义传入
execv	数组	需写完整路径	继承原进程
execvp	数组	自动搜 PATH	继承原进程
execve	数组	需写完整路径	自定义传入

底层本质：前 5 个都是库函数，最终都调用系统调用 execve 实现。

3. 实战：execlp 执行系统命令

#include <stdio.h> #include <unistd.h> #include <stdlib.h> int main(void) { pid_t pid = fork(); if (pid == 0) { // 子进程替换为 ls -l 命令 execlp("ls", "ls", "-l", NULL); // 只有执行失败才会走到这里 perror("execlp failed"); _exit(1); } wait(NULL); printf("子进程执行完毕，父进程结束\n"); return 0; }

4. 核心注意事项

exec 成功无返回值，失败返回 - 1，因此不需要判断成功分支，只处理错误即可
参数列表第一个参数必须是可执行文件名本身，最后必须以 NULL 结尾
程序替换后，原进程的文件描述符默认保持打开状态，除非设置了 FD_CLOEXEC 标志
真实的 PID 不变，只是用户空间内容被全部替换

四、孤儿进程与僵尸进程

这是进程模块最经典的面试题，两者都是进程生命周期异常的产物，但成因、危害、解决方案完全不同。

1. 孤儿进程

定义：父进程先于子进程退出，子进程失去父进程，就成为孤儿进程。

收养机制：Linux 内核会自动将孤儿进程收养给 PID 为 1 的 init/systemd 进程，由 init 负责后续的资源回收
危害：无实际危害，孤儿进程会正常运行，退出时由 init 回收资源，不会残留

2. 僵尸进程

定义：子进程先退出，父进程没有调用 wait/waitpid 回收资源，子进程的 PCB 残留在系统中，状态为 Z（zombie），就是僵尸进程。

成因：子进程退出后，内核保留 PCB 等待父进程读取状态，父进程不回收就会一直残留
危害：僵尸进程已经释放了大部分资源，只占用 PID 和少量 PCB 内存；但大量僵尸进程会耗尽系统 PID 号，导致无法创建新进程

3. 僵尸进程的解决方案

父进程主动回收：父进程调用 wait/waitpid 等待子进程退出，主动回收资源，这是最规范的做法
信号异步回收：子进程退出时会给父进程发送 SIGCHLD 信号，在信号处理函数中调用 waitpid 批量回收，不阻塞主业务
父进程退出，让 init 收养：让父进程先退出，子进程变成孤儿进程，由 init 负责回收，适合父进程无需等待子进程的场景
两次 fork：父进程 fork 一次，子进程再 fork 出孙子进程执行业务，子进程立刻退出，孙子进程变成孤儿由 init 收养，父进程回收子进程即可

五、拓展：守护进程实现

守护进程（Daemon）是运行在后台的特殊进程，脱离终端控制，生命周期长，常用于服务器、日志服务等后台常驻场景，是嵌入式与服务端开发的常用技术。

1. 标准实现步骤

fork 子进程，父进程退出：让子进程在后台运行，脱离终端控制
setsid 创建新会话：子进程成为新会话组长，彻底脱离原终端
修改工作目录：切换到根目录，避免占用挂载点导致无法卸载
重设 umask：重置文件权限掩码，避免继承父进程的限制
关闭文件描述符：关闭从父进程继承的所有文件描述符，将标准输入输出重定向到 /dev/null

2. 完整实现代码

#include <stdio.h> #include <unistd.h> #include <stdlib.h> #include <sys/stat.h> #include <fcntl.h> void daemon_create(void) { // 1. fork子进程，父进程退出 pid_t pid = fork(); if (pid > 0) exit(0); // 2. 创建新会话，脱离终端 setsid(); // 3. 改变工作目录到根目录 chdir("/"); // 4. 重置权限掩码 umask(0); // 5. 关闭所有文件描述符，重定向标准流到/dev/null int fd = open("/dev/null", O_RDWR); dup2(fd, STDIN_FILENO); dup2(fd, STDOUT_FILENO); dup2(fd, STDERR_FILENO); close(fd); } int main(void) { daemon_create(); // 守护进程主逻辑，后台循环运行 while (1) { sleep(1); // 业务逻辑 } return 0; }

六、面试高频考点与易错坑点

1. 经典面试问答

Q1：exit 和_exit 有什么核心区别？

答： exit 是 C 标准库函数，_exit 是系统调用。 exit 会执行 atexit 注册的回调函数、刷新所有标准 IO 缓冲区，完成用户态清理后再进入内核终止进程； _exit 直接进入内核终止进程，不执行用户态清理，不处理缓冲区。普通场景用 exit，fork 后子进程出错需要立刻退出、避免刷新父进程缓冲区时，用_exit。

Q2：什么是僵尸进程？成因是什么？有什么危害？怎么解决？

答：
子进程先退出，父进程没有调用 wait/waitpid 回收，子进程的 PCB 残留在系统中，就是僵尸进程。
成因：子进程退出后内核会保留退出状态等待父进程读取，父进程不回收就会一直残留。
危害：占用 PID 资源，大量僵尸会耗尽系统 PID，无法创建新进程。解决方案：父进程主动调用 wait/waitpid 回收；用 SIGCHLD 信号异步回收；让子进程变成孤儿由 init 回收。

Q3：exec 函数族的作用是什么？调用成功后有返回值吗？

答： exec 用于程序替换，用磁盘上的新可执行文件替换当前进程的全部用户空间内容，PID 保持不变。调用成功后不会返回，因为原代码已经被全部替换，后续代码不会执行；只有调用失败才会返回 - 1。

Q4：wait 和 waitpid 有什么区别？

答：
wait 只能阻塞等待任意一个子进程；waitpid 可以指定回收某个 PID 的子进程，也可以回收任意子进程。
wait 只能阻塞；waitpid 支持 WNOHANG 选项，实现非阻塞回收，没有已退出子进程时立刻返回。
waitpid 支持作业控制，可以等待进程组。工程中优先使用 waitpid，更灵活可控。

Q5：孤儿进程和僵尸进程有什么区别？哪个有危害？