性能分析工具
程序的性能分析一般包括 内存占用、 显存占用、 CPU时间、 I/O速率、 网络压力等。针对我们的需求,下面主要列举这些工具在内存占用、显存占用和CPU时间上的监测情况。
一. 针对python语言的性能分析工具
下面介绍的两个工具是针对python语言的性能分析工具,可以用于linux和windows等系统。psutil可以用于监测CPU时间和内存占用,pynvml可以用于监测GPU。
1.1 psutil
psutil是一个跨平台的系统和程序监控工具库,用于监控CPU、内存、磁盘、网络。
- 获取当前进程ID:
>>>import os
>>>ID = os.getpid()
- 获取指定进程对象
>>>import psutil
>>>p = psutil.Process(ID)
- 查看进程使用的CPU时间
>>>p.cpu_times()
pcputimes(user=0.081150144, system=0.053269812, children_user=0.0, children_system=0.0)
- 查看进程使用的内存情况
>>>p.momory_info()
pmem(rss=8310784, vms=2481725440, pfaults=3207, pageins=18)
1.2 pynvml
- pynvml是一个python库,可以获取显卡的详细信息。
- 使用方法:
from pynvml import *
nvmlInit() #初始化
print("Driver: "nvmlSystemGetDriverVersion()) #输出驱动信息
#查看各显卡型号
deviceCount = nvmlDeviceGetCount()
for i in range(deviceCount):
handle = nvmlDeviceGetHandleByIndex(i)
print("GPU", i, ":", nvmlDeviceGetName(handle))
#查看指定显卡的容量、剩余容量、已用容量
handle = nvmlDeviceGetHandleByIndex(0)
info = nvmlDeviceGetMemoryInfo(handle)
print("Memory Total: ",info.total)
print("Memory Free: ",info.free)
print("Memory Used: ",info.used)
#查看显卡的温度、风扇转速、电源状态信息
print("Temperature is %d C"%nvmlDeviceGetTemperature(handle,0))
print("Fan speed is "nvmlDeviceGetFanSpeed(handle))
print("Power ststus",nvmlDeviceGetPowerState(handle))
nvmlShutdown() #关闭管理工具
二. 针对C++语言的性能分析工具
下面介绍的三个工具是针对C++语言的性能分析工具,可以用于linux和windows等系统。psapi可以用于监测占用,cuda可以用于监测GPU,gperftools用于监测CPU。
2.1 PSAPI
- PSAPI主要用于检测内存,它可以获得某个程序占用内存的峰值和当前值。
- 使用方法
#include <psapi.h>
#pragma comment(lib, "psapi.lib")
void fun(){
HANDLE handle = GetCurrentProcess();
PROCESS_MEMORY_COUNTERS pmc;
GetProcessMemoryInfo(handle, &pmc, sizeof(pmc));
cout<<pmc.WorkingSetSize//占用内存的当前值
<<pmc.PeakWorkingSetSize<<endl;//占用内存的峰值
}
2.2 Cuda
- 利用安装好的cuda可以实时获取显存信息。
- 使用方法
#include <cuda.h>
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
cuda::setDevice(0);
size_t free total;
CUresult uRet = cuMemGetInfo(&free, &total);
cout<<free//未使用的显存容量
<<total;//显存总容量
2.3 gperftools
- gperftools是谷歌推出的性能监测工具,适合用于linux,在windows上使用较麻烦。使用示例如下:
//test.cpp
#include <gperftools/profiler.h>
#include <stdlib.h>
void f(){
for (int i=0; i<1024*1024; ++i){
char *p = (char*)malloc(1024*1024*120);
free(p);
}
}
int main(){
ProfilerStart("test.prof");//开启性能分析
f();
ProfilerStop();//停止性能分析
return 0;
}
- 编译生成a.out和test.prof:
gcc test.cpp -ltcmalloc -lprofiler
- 分析:
pprof --text a.out test.prof
- 输出结果:
3 21.4% 21.4% 3 21.4% f()
- 结果说明:
- 此函数中的分析样本数 # 当前函数采样次数
- 此函数中的分析样本的百分比 # 采样百分比
- 到目前为止打印的函数中的性能分析样本的百分比#look heapprofiler中的解释,第k行值是前面k行的采样百分比总和
- 此函数及其被调用者中的性能分析样本数#当前函数(包括子调用)累积采样次数
- 此函数及其被调用者中的分析样本的百分比#累积采样百分比
- 函数名称
三. 针对windows系统的性能分析工具
3.1 visual studio
- C++
- 在vs中运行代码时,通过“诊断工具”可以看到内存和CPU的使用情况
- 获取更详细的分析结果:分析 -> 性能探测器。
- python
- visual studio针对python只能分析GPU。
四. 结果展示
上面提到的方法可以实时获取内存、显存、CPU时间,然后可以使用python的matplotlib包绘制。