perf是Linux下C++性能分析利器,基于perf_events采样,无需修改代码即可定位热点函数与CPU瓶颈;需编译时加-g生成调试信息,用perf stat看整体指标,perf record/report分析函数级耗时,perf top实时监控,配合火焰图可直观展示调用栈。

C++ 程序性能分析中,perf 是 Linux 下非常强大的性能剖析工具,它基于内核的性能事件子系统(perf_events),无需修改代码即可对程序进行采样和统计,帮助定位热点函数、CPU 占用、缓存命中率等问题。
一、perf 工具简介与安装
perf 是 Linux 自带的性能分析工具,通常随 kernel-devel 或 linux-tools 包提供。
在 Ubuntu/Debian 上安装:
sudo apt install linux-tools-common linux-tools-generic
在 CentOS/RHEL 上:
立即学习“C++免费学习笔记(深入)”;
sudo yum install perf
验证是否可用:
perf –version
二、编译 C++ 程序时的准备
为了获得有意义的函数名和行号信息,编译时需加入调试符号:
说明:
-g:生成调试信息,perf 才能映射到具体函数和源码行-O2:保持优化级别接近生产环境,避免因关闭优化导致性能失真
三、常用 perf 命令与使用方法
1. perf stat:查看整体性能统计
perf stat ./myapp
输出包括:
CPU 周期数(cycles)指令执行数(instructions)IPC(每周期指令数)缓存命中/缺失上下文切换、页面错误等适合快速判断程序是否存在明显的 CPU 或内存瓶颈。
2. perf record + perf report:函数级热点分析
perf record -g ./myapp
运行完成后生成 perf.data 文件,再用:
perf report
查看采样结果,-g 表示记录调用栈,可展开函数调用关系。
在 perf report 界面中,可看到各函数占用 CPU 的百分比,定位耗时最多的函数。
3. perf top:实时监控正在运行的程序
perf top -p $(pgrep myapp)
类似 top 命令,但显示的是当前进程的函数级 CPU 占用,适合长时间运行服务的动态分析。
四、实际使用技巧与注意事项
符号解析问题
如果 perf report 显示的是地址而非函数名,检查是否:编译时加了 -g没有 strip 过二进制文件perf 版本与内核匹配
权限问题
某些系统需要调整 perf 权限:sudo sh -c ‘echo 1 > /proc/sys/kernel/perf_event_paranoid’
值设为 -1 可开启更多功能,1 或 2 更安全。
过滤特定线程或 CPU
perf record -t ./myappperf record -C 0 ./myapp # 限定 CPU0
指定采样频率
perf record -F 997 ./myapp
F 越高采样越密集,但开销也越大,997 是常用值。
基本上就这些。perf 结合火焰图(如使用 FlameGraph 工具)还能可视化调用栈,进一步提升分析效率。掌握这些方法后,C++ 性能瓶颈排查会更加高效直接。
以上就是c++++怎么使用perf工具进行性能分析_c++ perf工具性能分析方法的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1478317.html
微信扫一扫
支付宝扫一扫