在开发过程中,我们或多或少会关注服务的性能。但是性能优化相对来说比较困难,往往需要多轮的优化和测试,费时费力,有时可能不会有很好的效果。但如果有更好的性能优化方法指导和工具辅助分析,就可以快速找到性能瓶颈,有针对性地进行优化,事半功倍。
性能优化的难点在于找出关键的性能瓶颈。如果没有一些工具的帮助,很难找到这些瓶颈。例如,在c++程序中,大多数人可能使用perf /bcc工具来找出哪里有性能瓶颈。性能瓶颈的原因很多,CPU、内存、磁盘、架构等等。本文只关注CPU调优,即如何引流CPU性能,最大化CPU吞吐量。(其实CPU的性能出厂时就已经决定了,我们需要做的是让CPU尽可能做有用的工作。)所以为了优化CPU利用率,我们其实是发现自己写的代码不够好,没有优化。
一、示例
#include <stdlib.h>
#define CACHE_LINE attribute((aligned(64)))
struct S1
{
int r1;
int r2;
int r3;
S1 ():r1 (1), r2 (2), r3 (3){}
} CACHE_LINE;
void add(const S1 smember[],int members,long &total) {
int idx = members;
do {
total += smember[idx].r1;
total += smember[idx].r2;
total += smember[idx].r3;
}while(–idx);
}
int main (int argc, char *argv[]) {
const int SIZE = 204800;
S1 *smember = (S1 *) malloc (sizeof (S1) * SIZE);
long total = 0L;
int loop = 10000;
while (

本文介绍了C/C++性能优化的重要性,并以CPU流水线为切入点,探讨了如何通过TMAM(自上而下分析)方法论定位并优化CPU性能瓶颈。文中提供了一个简单的代码示例,解释了CPU流水线的工作原理,帮助开发者理解如何提高CPU利用率和程序性能。
最低0.47元/天 解锁文章
3422

被折叠的 条评论
为什么被折叠?



