gprof

一 gprof功能简介

Gprof功能:打印出程序运行中各个函数消耗的时间,可以帮助程序员找出众多函数中耗时最多的函数。产生程序运行时候的函数调用关系,包括调用次数,可以帮助程序员分析程序的运行流程。

有了函数的调用关系,这会让开发人员大大提高工作效率,不用费心地去一点点找出程序的运行流程,这对小程序来说可能效果不是很明显,但对于有几万,几十万代码量的工程来说,效率是毋庸置疑的!而且这个功能对于维护旧代码或者是分析OpenSource来说那是相当诱人的,有了调用图,对程序的运行框架也就有了一个大体了解,知道了程序的"骨架",分析它也就不会再那么茫然,尤其是对自己不熟悉的代码和OpenSource。费话不多说了,让我们开始我们的分析之旅吧!

二 gprof实现原理

通过在编译和链接你的程序的时候(使用 -pg编译和链接选项),gcc 在你应用程序的每个函数中都加入了一个名为mcount ( or "_mcount" , or"__mcount" , 依赖于编译器或操作系统)的函数,也就是说你的应用程序里的每一个函数都会调用mcount, 而mcount会在内存中保存一张函数调用图,并通过函数调用堆栈的形式查找子函数和父函数的地址。这张调用图也保存了所有与函数相关的调用时间,调用次数等等的所有信息。

三 常用的gprof命令选项:

-b 不再输出统计图表中每个字段的详细描述。

-p 只输出函数的调用图(Callgraph的那部分信息)。

-q 只输出函数的时间消耗列表。

-e Name 不再输出函数Name及其子函数的调用图(除非它们有未被限制的其它父函数)。可以给定多个 -e 标志。一个 -e 标志只能指定一个函数。

-E Name 不再输出函数Name及其子函数的调用图,此标志类似于 -e 标志,但它在总时间和百分比时间的计算中排除了由函数Name 及其子函数所用的时间。

-f Name 输出函数Name及其子函数的调用图。可以指定多个 -f 标志。一个 -f 标志只能指定一个函数。

-F Name 输出函数Name及其子函数的调用图,它类似于 -f 标志,但它在总时间和百分比时间计算中仅使用所打印的例程的时间。可以指定多个 -F 标志。一个 -F标志只能指定一个函数。-F 标志覆盖 -E 标志。

-z显示使用次数为零的例程(按照调用计数和累积时间计算)。

四 尝试示例

Test.c

#include<stdio.h>

int prime(int n)

{

int i;

for (i=2; i<n; i++)

{

if (n%i == 0)

return 0;

return 1;

}

}

void main(void)

{

int i, n;

n = 1000;

for (i=2; i<=n;i++)

{

if (prime(i))

printf("%d\n",i);

}

}

Gcc -pg -o test test.c

./test

gprof -b test gmon.out|less

Flat profile:

Each sample counts as0.01 seconds.

% cumulative self selftotal

time seconds secondscalls Ts/call Ts/call name

100.00 0.02 0.02 main

0.00 0.02 0.00 9990.00 0.00 prime

^L

Call graph

granularity: eachsample hit covers 4 byte(s) for 50.00% of 0.02 seconds

index % time selfchildren called name

<spontaneous>

[1] 100.0 0.02 0.00main [1]

0.00 0.00 999/999prime [2]

-----------------------------------------------

0.00 0.00 999/999 main[1]

[2] 0.0 0.00 0.00 999prime [2]

-----------------------------------------------

^L

Index by function name

[1] main [2] prime

五 使用注意:

1)一般gprof只能查看用户函数信息。如果想查看库函数的信息,需要在编译是再加入"-lc_p"编译参数代替"-lc"编译参数,这样程序会链接libc_p.a库,才可以产生库函数的profiling信息。

2)gprof只能在程序正常结束退出之后才能生成程序测评报告,原因是gprof通过在atexit()里注册了一个函数来产生结果信息,任何非正常退出都不会执行atexit()的动作,所以不会产生gmon.out文件。如果你的程序是一个不会退出的服务程序,那就只有修改代码来达到目的。如果不想改变程序的运行方式,可以添加一个信号处理函数解决问题(这样对代码修改最少),例如:

static voidsighandler( int sig_no )

{

exit(0);

}

signal( SIGUSR1,sighandler );

当使用kill -USR1 pid后,程序退出,生成gmon.out文件。

gprof产生的信息

% the percentage ofthe total running time of the

time program used bythis function.

函数使用时间占所有时间的百分比。

cumulative a runningsum of the number of seconds accounted

seconds for by thisfunction and those listed above it.

函数和上列函数累计执行的时间。

self the number ofseconds accounted for by this

seconds functionalone. This is the major sort for this

listing.

函数本身所执行的时间。

calls the number oftimes this function was invoked, if

this function isprofiled, else blank.

函数被调用的次数

self the averagenumber of milliseconds spent in this

ms/call function percall, if this function is profiled,

else blank.

每一次调用花费在函数的时间microseconds。

total the averagenumber of milliseconds spent in this

ms/call function andits descendents per call, if this

function is profiled,else blank.

每一次调用,花费在函数及其衍生函数的平均时间microseconds。

name the name of thefunction. This is the minor sort

for this listing. Theindex shows the location of

the function in thegprof listing. If the index is

in parenthesis itshows where it would appear in

the gprof listing ifit were to be printed.

函数名

### 使用 gprof 进行性能分析及其与 bch 的关联 #### 什么是 gprof? `gprof` 是 GNU Profiler 工具,用于程序的性能分析。它能够提供关于函数调用次数、执行时间以及其他统计信息的数据[^1]。 #### 如何使用 gprof? 为了使用 `gprof` 对程序进行性能分析,需要遵循以下方法: 1. **编译程序时启用 profiling 支持** 编译源代码时需加上 `-pg` 参数以便生成可供 `gprof` 分析的信息文件。 ```bash gcc -o my_program my_program.c -pg ``` 2. **运行程序并生成数据文件** 当带有 `-pg` 参数编译后的可执行文件被运行时,会自动生成名为 `gmon.out` 的文件,该文件包含了程序运行期间的性能统计数据[^2]。 3. **分析数据** 使用 `gprof` 命令读取 `gmon.out` 文件来获取详细的性能报告。 ```bash gprof ./my_program gmon.out > analysis.txt ``` 此命令将把分析结果重定向到 `analysis.txt` 中,便于查看和保存。 #### 关于 bch 和 gprof 的关系 `bch` 并不是标准术语或者工具名称,在此上下文中可能指的是某种特定环境下的缓存命中率(Cache Hit Rate)。如果假设这里的 `bch` 表示的是缓存行为,则可以利用 `gprof` 来间接评估缓存效率的影响。通过观察不同部分代码的时间消耗分布情况,推测哪些地方可能存在频繁访问内存的情况从而影响缓存效果[^3]。 然而需要注意的是,`gprof` 主要关注 CPU 时间分配而非具体的硬件层面操作比如 L1/L2 cache 或者 branch prediction 等细节;因此对于深入研究诸如分支预测失败成本或者是更精细级别的存储器子系统表现来说,其他专门设计用来测量这些特性的工具可能会更加合适一些,例如 Intel VTune Amplifier XE, Perf Events (Linux), 或者 Oprofile 等高级剖析工具[^4]。 ```python def example_function(): pass # Replace with actual logic to profile. ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值