Gprof

本文介绍了如何利用gprof进行程序性能分析,包括编译参数设置、生成gmon.out、使用gprof解析数据及可视化。通过示例代码展示了不同函数填充方式的时间成本,强调了gprof在用户函数分析上的局限性和对于服务器程序的适用性问题,同时提到了gprof的不足之处,如无法分析内核态执行的程序和需要重新编译等。

1.官网链接

官网链接

写的不错

写的不错+1

2.使用方法与测试代码

1.编译时加-pg参数
g++ -O1 -g -pg 001.cpp               #生成可执行文件a.out

2.执行你的应用程序使之生成供gprof分析的数据gmon.out
./a.out                              #执行可执行文件生成文件gmon.out

3.分析数据
gprof a.out gmon.out > gprof.out     #执行gprof  exename gmon.out将结果写到gprof.out
vim -c 'set nowrap' gprof.out        #查看gprof.out中的内容

4.可视化你的数据
gprof ./a.out  | ./gprof2dot.py -n0 -e0 | dot -Tpng -o output.png
gprof ./a.out  | ./gprof2dot.py -n0 -e0 | dot -Tpdf -o output.pdf
(我推荐pdf形式的,可承载较大且我感觉更清晰)
#include <iostream>
#include <string.h>
using namespace std;
#define LOOPS 10000000
void test01()
{
   char buffer[80];
   auto t1 = clock();
   for(auto i = 0;i<LOOPS;++i)
   {
       memset(buffer,0,sizeof(buffer));
   }
   auto t2 = clock();
   cout << "cost " << (t2-t1)*1.0 <<endl;
}
void test02()
{
    char buffer[80];
    auto t1 = clock();
     for(auto i = 0;i<LOOPS;++i)
     {
         for(size_t j = 0;j < sizeof buffer;++j)
         {
             buffer[j] = 0;
         }
     }
    auto t2 = clock();
    cout << "cost " << (t2-t1)*1.0 <<endl;
}
void test03()
{
    volatile char buffer[80];
    auto t1 = clock();
     for(auto i = 0;i<LOOPS;++i)
     {
         for(size_t j = 0;j < sizeof buffer;++j)
         {
             buffer[j] = 0;
         }
     }
    auto t2 = clock();
    cout << "cost " << (t2-t1)*1.0 <<endl;
}

int main()
{  
      for(int i = 0;i<50;i++)
      {
         test01();
      } 
      test02();
      test03();
}

3.下载可视化工具及生成图片

yum install graphviz
wget https://github.com/jrfonseca/gprof2dot/blob/master/gprof2dot.py

4.Gprof的原理

Gprof的实现原理

Gprof的原理与缺陷

通过在编译和链接你的程序的时候(使用 -pg 编译和链接选项),gcc 在你应用程序的每个函数中都
加入了一个名为mcount(or “_mcount” , or “__mcount” , 依赖于编译器或操作系统)的函数,也就
是说你的应用程序里的每一个函数都会调用mcount, 而mcount会在内存中保存一张函数调用图,并通过
函数调用堆栈的形式查找子函数和父函数的地址.这张调用图也保存了所有与函数相关的调用时间、调用
次数等等的所有信息.

5.使用注意点

(1)一般gprof只能查看用户函数信息。如果想查看库函数的信息,需要在编译是再加入“-lc_p”编译参
  数代替“-lc”编译参数,这样程序会链接libc_p.a库,才可以产生库函数的profiling信息;
(2)gprof只能在程序正常结束退出之后才能生成程序测评报告,原因是gprof通过在atexit()里注册了
   一个函数来产生结果信息,任何非正常退出都不会执行atexit()的动作,所以不会产生gmon.out文件.
   如果你的程序是一个不会退出的服务程序,那就只有修改代码来达到目的。如果不想改变程序的运行方
   式,可以添加一个信号处理函数解决问题(这样对代码修改最少),例如:
   static void sighandler( int sig_no )   
   {   
      exit(0);   
   }   
   signal( SIGUSR1, sighandler );
   当使用kill -USR1 pid 后,程序退出,生成gmon.out文件.

5.Gprof的缺陷

(1)gprof是GNU工具之一,它在编译的时候在每个函数的出入口加入了profiling的代码,运行时统计
程序在用户态的执行信息, 可以得到每个函数的调用次数、执行时间、调用关系等信息,简单易懂. 适
合于查找用户级程序的性能瓶颈, 对于很多时间都在内核态执行的程序,gprof不适合.

(2)需要重新编译链接源文件才行;

(3)对于服务器程序,一般是不会退出的. 如果程序没有正常退出,g++是不会生成最后的gmon.out统计
   结果的.所以gprof也就用不上了; 对于这种情况有一个解决办法: 在程序开始时注册一个信号捕获
   函数,如果收到注册的信号(比如SIGINT Ctrl-C),程序执行exit()的话,最后也是可以生成gmon.out
   的。

### 使用 gprof 进行性能分析及其与 bch 的关联 #### 什么是 gprof? `gprof` 是 GNU Profiler 工具,用于程序的性能分析。它能够提供关于函数调用次数、执行时间以及其他统计信息的数据[^1]。 #### 如何使用 gprof? 为了使用 `gprof` 对程序进行性能分析,需要遵循以下方法: 1. **编译程序时启用 profiling 支持** 编译源代码时需加上 `-pg` 参数以便生成可供 `gprof` 分析的信息文件。 ```bash gcc -o my_program my_program.c -pg ``` 2. **运行程序并生成数据文件** 当带有 `-pg` 参数编译后的可执行文件被运行时,会自动生成名为 `gmon.out` 的文件,该文件包含了程序运行期间的性能统计数据[^2]。 3. **分析数据** 使用 `gprof` 命令读取 `gmon.out` 文件来获取详细的性能报告。 ```bash gprof ./my_program gmon.out > analysis.txt ``` 此命令将把分析结果重定向到 `analysis.txt` 中,便于查看和保存。 #### 关于 bch 和 gprof 的关系 `bch` 并不是标准术语或者工具名称,在此上下文中可能指的是某种特定环境下的缓存命中率(Cache Hit Rate)。如果假设这里的 `bch` 表示的是缓存行为,则可以利用 `gprof` 来间接评估缓存效率的影响。通过观察不同部分代码的时间消耗分布情况,推测哪些地方可能存在频繁访问内存的情况从而影响缓存效果[^3]。 然而需要注意的是,`gprof` 主要关注 CPU 时间分配而非具体的硬件层面操作比如 L1/L2 cache 或者 branch prediction 等细节;因此对于深入研究诸如分支预测失败成本或者是更精细级别的存储器子系统表现来说,其他专门设计用来测量这些特性的工具可能会更加合适一些,例如 Intel VTune Amplifier XE, Perf Events (Linux), 或者 Oprofile 等高级剖析工具[^4]。 ```python def example_function(): pass # Replace with actual logic to profile. ```
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值