Linux如何查看僵尸进程并清理

程序猿 • 2025年11月24日 12:44:20 • 用户投稿 • 阅读 1

僵尸进程是已终止但未被父进程回收的进程，可通过ps aux | grep Z识别，其本质不耗资源但反映父进程管理缺陷，清理需通过重启或终止父进程使其被init回收，预防应注重父进程正确处理子进程退出。

僵尸进程在Linux中，通常指的是一个已经完成了执行，但其父进程还没有调用

wait()

或

waitpid()

来获取其终止状态的进程。你可以通过

ps aux | grep Z

或在

top

命令中查看

STAT

列找到它们。清理僵尸进程的唯一有效方法是让其父进程正确地“收割”它，如果父进程本身有问题，通常需要重启父进程，或者在极端情况下，终止父进程，让

init

进程来处理。

解决方案

在我看来，处理僵尸进程首先要做的就是理解它，而不是盲目地去“杀”它，因为僵尸进程本身是无法被杀死的。它们已经死了，只是留了个“尸体”在进程表里。

1. 识别僵尸进程

最直接的方式就是使用

ps

命令：

ps aux | grep Z

这条命令会列出所有处于

状态（Zombie）的进程。输出中，你需要关注

PID

(进程ID)、

PPID

(父进程ID) 和

COMMAND

(命令)。

或者，你也可以在

top

命令的输出中留意

状态的进程。通常

top

会在顶部显示僵尸进程的数量，例如

Tasks: 200 total, 1 running, 198 sleeping, 0 stopped, 1 zombie

。

2. 理解僵尸进程的本质

僵尸进程本身几乎不占用系统资源，除了一个进程表条目。它不消耗CPU，不占用内存，也不持有文件句柄。所以，少数几个僵尸进程通常不是性能问题，但它们是父进程管理不当的信号。真正的“问题”在于那个没有正确处理子进程退出的父进程。

3. 清理僵尸进程的方法

既然僵尸进程不能被直接杀死，我们的目标就是让其父进程去收割它。

找到父进程：一旦你识别出僵尸进程的PID，你需要找到它的父进程PID (PPID)。在

ps aux

的输出中通常就能看到，或者你可以用：

ps -o ppid= -p

例如，如果僵尸进程PID是

，那么

ps -o ppid= -p 12345

就能得到它的父进程PID。

处理父进程：

重启父进程： 如果父进程是一个服务或应用程序，最温和且通常有效的方法是重启这个父进程对应的服务。比如，如果父进程是

apache

或

nginx

的某个 worker，你可以尝试重启整个

apache

或

nginx

服务。当父进程重启时，它通常会重新初始化并正确处理其子进程。发送

SIGCHLD

信号（不保证有效）： 理论上，你可以尝试向父进程发送

SIGCHLD

信号，这可能会促使父进程去检查其子进程的状态。

kill -s SIGCHLD

但说实话，如果父进程本身设计就有缺陷，没有正确处理

SIGCHLD

信号或没有调用

wait()

，那么这个方法可能不会奏效。它只是一个尝试。

杀死父进程（最直接但可能中断服务）： 这是最直接，也往往是最有效的清理僵尸进程的方法。当你杀死父进程后，这些僵尸进程就会被

init

进程（PID 1）收养。

init

进程有一个特殊的能力，它会定期检查并收割所有被它收养的僵尸子进程。

kill -9

注意： 杀死父进程会导致该服务或应用程序中断。请确保你了解其影响，并在生产环境中谨慎操作。

特殊情况：

init

进程作为父进程如果僵尸进程的PPID是

(也就是

init

或

systemd

进程)，这通常意味着父进程在创建子进程后，自身已经崩溃或异常退出，导致子进程成为孤儿进程，并被

init

收养。在这种情况下，

init

进程通常会自动清理这些僵尸。如果

init

的子进程仍然是僵尸，这可能指向更深层次的系统问题，比如内核错误或

init

进程本身的问题，这种情况非常罕见，需要更专业的诊断。

僵尸进程对系统性能有何影响？它真的有害吗？

在我看来，这是很多人对僵尸进程最大的误解之一。从资源消耗的角度来看，僵尸进程几乎是无害的。它们已经完成了执行，不再占用CPU时间，也不再使用内存或文件句柄。它们仅仅在系统的进程表中保留了一个条目，用来存储其退出状态，以便父进程可以查询。

AI帮个忙

多功能AI小工具，帮你快速生成周报、日报、邮、简历等

116 查看详情

那么，它们真的有害吗？直接的回答是：通常情况下，少数僵尸进程本身并不会对系统性能造成实质性的影响。它们消耗的资源微乎其微。

然而，我更倾向于把僵尸进程看作是一种“症状”而非“疾病”本身。它们的存在，尤其是大量僵尸进程的出现，强烈暗示着其父进程存在问题。这个父进程可能：

编程错误： 没有正确地处理子进程的终止，比如忘记调用

wait()

或

waitpid()

。资源泄漏： 父进程可能除了没有收割子进程外，还在其他方面存在资源泄漏（内存、文件句柄等），这才是真正可能导致系统不稳定的因素。服务不稳定： 一个无法正确管理子进程的服务，其整体稳定性也值得怀疑。它可能在其他地方也存在缺陷，导致服务中断或行为异常。PID耗尽（极端情况）： Linux系统对可以分配的PID数量有一个上限（由

/proc/sys/kernel/pid_max

控制，通常是32768或更高）。如果系统产生数万个僵尸进程，理论上可能会耗尽PID资源，导致新的进程无法创建。但这在实际应用中非常罕见，因为父进程在产生如此多僵尸之前，通常就已经崩溃或被管理员注意到了。

所以，当看到僵尸进程时，我的第一反应不是恐慌，而是把它当作一个信号，去检查其父进程的健康状况和代码逻辑。

为什么会出现僵尸进程？常见的生成原因有哪些？

要理解僵尸进程的产生，我们得从进程生命周期的角度来看待。一个进程在Linux中，从创建到结束，会经历一系列状态。当一个子进程完成其任务并退出时，它并没有立即从进程表中消失。它会进入“僵尸”状态，等待其父进程来读取它的退出状态。这个机制是为了让父进程能够知道子进程是成功完成还是失败退出，以及其具体的退出码。

那么，为什么父进程会“忘记”来收割它的子进程呢？常见的生成原因通常包括：

父进程编程缺陷： 这是最主要的原因。在多进程编程中，父进程需要显式地调用

wait()

或

waitpid()

系列函数来等待子进程终止并回收其资源。如果程序员忘记了这一步，或者在代码逻辑中没有妥善处理所有可能的子进程退出路径，那么子进程就会变成僵尸。

忽略

SIGCHLD

信号： 当子进程终止时，内核会向父进程发送

SIGCHLD

信号。如果父进程设置了忽略这个信号，或者没有为它编写一个合适的信号处理函数来调用

wait()

，那么僵尸进程就可能产生。没有在信号处理函数中循环调用

waitpid()

：一个常见的错误是，在

SIGCHLD

信号处理函数中只调用了一次

waitpid()

。但如果多个子进程几乎同时退出，可能只会收到一个

SIGCHLD

信号。正确的做法是在信号处理函数中循环调用

waitpid()

，并带上

WNOHANG

选项，直到没有更多的子进程需要收割。

父进程在子进程退出前崩溃： 如果父进程在子进程退出之前就因为某种原因崩溃了，那么子进程会成为“孤儿进程”，并被

init

进程（PID 1）收养。

init

进程有责任定期收割其所有孤儿子进程。但如果子进程在成为孤儿后立即退出，并且

init

还没有来得及收割它，它可能会短暂地以僵尸状态存在，直到

init

下次扫描时将其清理。不过，这种情况下的僵尸通常是瞬时且无害的。

不恰当的进程管理： 有些应用程序或脚本可能会创建大量的子进程，但没有一个健全的机制来管理它们的生命周期。例如，一个Web服务器可能会为每个请求派生一个子进程，但如果请求处理完毕后，父进程没有及时回收这些子进程，就会累积僵尸进程。

死锁或挂起的父进程： 如果父进程因为死锁、无限循环或其他原因而挂起，无法执行到调用

wait()

的代码段，那么即使子进程退出了，父进程也无法及时收割它们。

总而言之，僵尸进程的出现，几乎总是提醒我们，在父进程的设计或实现上存在一些需要改进的地方。

如何预防僵尸进程的产生？有没有最佳实践？

预防僵尸进程的产生，核心在于父进程要妥善管理其子进程的生命周期。这不仅仅是技术问题，更是一种编程习惯和系统设计的考量。

正确使用

wait()

或

waitpid()

：这是最基本也是最重要的原则。当父进程创建子进程后，它应该在适当的时机调用

wait()

或

waitpid()

来等待子进程终止并回收其资源。

wait()

会阻塞父进程，直到一个子进程终止。

waitpid(pid, &status, options)

提供了更精细的控制，例如可以指定等待哪个子进程，或者使用

WNOHANG

选项使其非阻塞。

实现

SIGCHLD

信号处理函数：这是处理异步子进程终止的最佳实践。当子进程终止时，内核会向父进程发送

SIGCHLD

信号。父进程应该捕获这个信号，并在信号处理函数中调用

waitpid()

来收割子进程。关键在于，

waitpid()

应该在循环中调用，并带上

WNOHANG

选项，以确保所有已终止的子进程都被收割，并且信号处理函数不会阻塞：

#include #include #include #include  // for fork, sleepvoid sigchld_handler(int signo) {    // 使用循环和 WNOHANG 选项，确保回收所有已终止的子进程    while (waitpid(-1, NULL, WNOHANG) > 0) {        // 子进程被收割        // fprintf(stderr, "Child reaped by signal handler.n");    }}int main() {    struct sigaction sa;    sa.sa_handler = sigchld_handler;    sigemptyset(&sa.sa_mask);    sa.sa_flags = SA_RESTART | SA_NOCLDSTOP; // SA_NOCLDSTOP 避免在子进程停止时发送信号    if (sigaction(SIGCHLD, &sa, 0) == -1) {        perror("sigaction");        return 1;    }    pid_t pid = fork();    if (pid == -1) {        perror("fork");        return 1;    } else if (pid == 0) { // Child process        printf("Child process %d running...n", getpid());        sleep(2); // Simulate some work        printf("Child process %d exiting.n", getpid());        _exit(0); // Use _exit to avoid flushing parent's buffers    } else { // Parent process        printf("Parent process %d forked child %d.n", getpid(), pid);        // Parent does its own work, will be notified by SIGCHLD        sleep(5);        printf("Parent process exiting.n");    }    return 0;}

通过这种方式，即使父进程正在忙于其他任务，也能异步地处理子进程的终止。

双重 fork（Double-fork）技巧：对于需要后台运行的守护进程（daemon），一个常见的技巧是使用双重

fork

。

父进程

fork

出第一个子进程。父进程立即退出。这使得第一个子进程成为孤儿，并被

init

进程收养。第一个子进程再

fork

出第二个子进程，并立即退出。第二个子进程就是最终的守护进程。由于第一个子进程退出了，它会成为

init

的一个僵尸，但

init

会自动清理它。而最终的守护进程（第二个子进程）的父进程现在是

init

，

init

会负责收割它，避免了原始父进程需要处理子进程的问题。

使用进程管理器：在现代Linux系统中，我们很少直接编写复杂的

fork/wait

逻辑。更常见和推荐的做法是使用成熟的进程管理器，如

systemd

、

supervisord

、

pm2

(Node.js) 等。这些工具本身就设计用来管理服务的生命周期，包括启动、停止、重启，以及最重要的一点——它们会妥善处理其管理的进程的子进程，确保不会产生僵尸。

代码审查和测试：定期对涉及进程创建和管理的应用程序代码进行审查，确保所有子进程的终止都被正确处理。进行充分的测试，模拟子进程正常退出、异常退出等各种场景，以验证代码的健壮性。

通过这些最佳实践，我们可以大大减少僵尸进程的产生，确保系统运行的稳定性和资源的有效利用。毕竟，一个健康的系统，进程表里不应该有“死而不僵”的幽灵。

以上就是Linux如何查看僵尸进程并清理的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/715897.html

ai apache js linux linux系统 nginx node node.js 为什么工具

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Microsoft Teams如何创建团队空间 Microsoft Teams团队协作的搭建指南

上一篇 2025年11月24日 12:44:18

Java Swing：在不同方法中有效访问和管理JFrame实例

下一篇 2025年11月24日 12:44:22

用户投稿

CSS mask属性无法获取图片：为什么我的图片不见了？

CSS mask属性无法获取图片在使用CSS mask属性时，可能会遇到无法获取指定照片的情况。这个问题通常表现为：网络面板中没有请求图片：尽管CSS代码中指定了图片地址，但网络面板中却找不到图片的请求记录。问题原因：此问题的可能原因是浏览器的兼容性问题。某些较旧版本的浏览器可能不支持CSS…

程序猿
2025年12月24日
12100
用户投稿

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
6000
用户投稿

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
11001
用户投稿

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
12000
用户投稿

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
用户投稿

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
11000
为什么设置 `overflow: hidden` 会导致 `inline-block` 元素错位？

overflow 导致 inline-block 元素错位解析当多个 inline-block 元素并列排列时，可能会出现错位显示的问题。这通常是由于其中一个元素设置了 overflow 属性引起的。问题现象在不设置 overflow 属性时，元素按预期显示在同一水平线上：不设置 overf…

程序猿
2025年12月24日 • 用户投稿
8000
用户投稿

网页使用本地字体：为什么 CSS 代码中明明指定了“荆南麦圆体”，页面却仍然显示“微软雅黑”？

网页中使用本地字体本文将解答如何将本地安装字体应用到网页中，避免使用 src 属性直接引入字体文件。问题：想要在网页上使用已安装的“荆南麦圆体”字体，但 css 代码中将其置于第一位的“font-family”属性，页面仍显示“微软雅黑”字体。立即学习“前端免费学习笔记（深入）”；答案： …

程序猿
2025年12月24日
7000
用户投稿

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
12000
用户投稿

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
7000
用户投稿

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
3000
用户投稿

为什么我的特定 DIV 在 Edge 浏览器中无法显示？

特定 DIV 无法显示：用户代理样式表的困扰当你在 Edge 浏览器中打开项目中的某个 div 时，却发现它无法正常显示，仔细检查样式后，发现是由用户代理样式表中的 display none 引起的。但你疑问的是，为什么会出现这样的样式表，而且只针对特定的 div？背后的原因用户代理样式表是由…

程序猿
2025年12月24日
5000
用户投稿

inline-block元素错位了，是为什么？

inline-block元素错位背后的原因 inline-block元素是一种特殊类型的块级元素，它可以与其他元素行内排列。但是，在某些情况下，inline-block元素可能会出现错位显示的问题。错位的原因当inline-block元素设置了overflow:hidden属性时，它会影响元素的…

程序猿
2025年12月24日
4000
用户投稿

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
用户投稿

为什么使用 inline-block 元素时会错位？

inline-block 元素错位成因剖析在使用 inline-block 元素时，可能会遇到它们错位显示的问题。如代码 demo 所示，当设置了 overflow 属性时，a 标签就会错位下沉，而未设置时却不会。问题根源： overflow:hidden 属性影响了 inline-block …

程序猿
2025年12月24日
1000
用户投稿

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
用户投稿

为什么我的 CSS 元素放大效果无法正常生效？

css 设置元素放大效果的疑问解答原提问者在尝试给元素添加 10em 字体大小和过渡效果后，未能在进入页面时看到放大效果。探究发现，原提问者将 CSS 代码直接写在页面中，导致放大效果无法触发。解决办法如下：将 CSS 样式写在一个单独的文件中，并使用标签引入该样式文件。这个操作与原提问者观…

程序猿
2025年12月24日
3000
用户投稿

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
用户投稿

为什么我的 em 和 transition 设置后元素没有放大？

元素设置 em 和 transition 后不放大一个 youtube 视频中展示了设置 em 和 transition 的元素在页面加载后会放大，但同样的代码在提问者电脑上没有达到预期效果。可能原因：问题在于 css 代码的位置。在视频中，css 被放置在单独的文件中并通过 link 标签引…

程序猿
2025年12月24日
7000
用户投稿

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000