手把手教你用Strace诊断问题

曾经,如果你熟悉 strace 命令,那你一定被视为高手,而今 strace 已是家喻户晓的工具。当你遇到性能问题并寻求帮助时,大多数人会建议你使用 strace 进行跟踪。然而,面对屏幕上滚动的字符,往往很难找出问题的根源。本文通过一个实际案例,展示在使用 strace 进行问题诊断时的一些技巧。

以下是一个真实案例,相似之处纯属巧合!我们来看一下一台高负载服务器的 top 结果:

手把手教你用Strace诊断问题top

提示:在运行 top 时,按「1」键可查看 CPU 列表,按「shift+p」键按 CPU 使用率排序。

在本例中,我们可以轻易发现 CPU 主要被多个 PHP 进程占用,同时这些 PHP 进程也占用了相当多的内存,但系统内存尚有剩余,SWAP 使用情况也不严重,这并不是问题的主要原因。

然而,在 CPU 列表中我们可以看到,CPU 主要消耗在内核态「sy」而不是用户态「us」,这与我们的经验不符。Linux 操作系统中有许多用于跟踪程序行为的工具,内核态的函数调用跟踪使用「strace」,用户态的函数调用跟踪使用「ltrace」。因此,这里我们应该使用「strace」:

shell> strace -p 

但如果直接使用 strace 跟踪某个进程,往往会面对满屏滚动的字符,从中找出问题的症结并不容易。幸运的是,strace 可以按操作汇总时间:

shell> strace -cp 

通过「c」选项可以汇总各个操作的总耗时,运行后的结果大致如下图所示:

手把手教你用Strace诊断问题strace -cp

AI建筑知识问答 AI建筑知识问答

用人工智能ChatGPT帮你解答所有建筑问题

AI建筑知识问答 22 查看详情 AI建筑知识问答

很明显,我们可以看到 CPU 主要被 clone 操作消耗了,我们可以单独跟踪 clone 操作:

shell> strace -T -e clone -p 

通过「T」选项可以获取操作的实际耗时,通过「e」选项可以跟踪某个特定操作:

手把手教你用Strace诊断问题strace -T -e clone -p

显然,一个 clone 操作需要几百毫秒,关于 clone 的含义,可以参考 man 文档:

简单来说,就是创建一个新进程。那么在 PHP 中,什么时候会出现这种系统调用呢?在检查业务代码时发现了 exec 函数,通过如下命令验证它确实会导致 clone 系统调用:

shell> strace -eclone php -r 'exec("ls");'

最后,再给大家出个题:如果我们用 strace 跟踪一个进程,输出结果很少,是不是说明进程很空闲?其实试试 ltrace,可能会发现别有洞天。记住,内核态和用户态是有区别的。

以上就是手把手教你用Strace诊断问题的详细内容,更多请关注php中文网其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/483289.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 12:20:25
下一篇 2025年11月8日 12:25:11

相关推荐

发表回复

登录后才能评论
关注微信