优化数据结构与缓存行-优快云博客

http://blog.sina.com.cn/s/blog_1314fdaf10102uxgg.html

当一个C P U从内存读取一个字节时，它不只是取出一个字节，它要取出足够的字节来填入高速缓存行。高速缓存行可能包含32（老式cpu）、64、128字节，这要根据cpu而定。高速缓存行的作用是为了提高C P U运行的性能。通常情况下，应用程序只能对一组相邻的字节进行处理。如果这些字节在高速缓存中，那么C P U就不必访问内存总线，而访问内存总线需要多得多的时间。

高速缓存行在多处理器系统中引发的问题

cpu1和CPu2读取同一个字节，这将会使该字节和与他相邻的字节读到cpu1和cpu2各自的高速缓存行中；假如cpu1修改了高速缓冲行中字节时，系统会强制cpu1将修改后的字节写回到内存中并且会通知处cpu1以外的cpu2的高速缓冲行作废。当CPU2进行读取数据时会从新读取内存中的字节。

如果CPU1和cpu2不修改字节，再次读取字节时，只会读取自己高速缓冲行的字节，而不会读取内存。

从上面可以知道，如果多处理器同时读取相同数据将会损伤性能。

引用书上的两段示例代码

读写混放的数据结构（只读与读写的数据放入同一个高速缓存，不好的做法）：

 
struct CUSTINFO
{
   DWORD    dwCustomerID;    //Mostly read-only
   int      nBalanceDue;     //Read-write
   char     szName[100];     //Mostly read-only
   FILETIME ftLastOrderDate;  //Read-write
};

改版后的结构定义:

 
   
 
// Determine the cache line size for the host CPU.
//为各种CPU定义告诉缓存行大小
#ifdef _X86_
#define CACHE_ALIGN  32
#endif
#ifdef _ALPHA_
#define CACHE_ALIGN  64
#endif
#ifdef _IA64_
#define CACHE_ALIGN  ??
#endif

#define CACHE_PAD(Name, BytesSoFar) \
   BYTE Name[CACHE_ALIGN - ((BytesSoFar) % CACHE_ALIGN)]

struct CUSTINFO
{
   DWORD    dwCustomerID;     // Mostly read-only
   char     szName[100];      // Mostly read-only

   //Force the following members to be in a different cache line.
   //这句很关键用一个算出来的Byte来填充空闲的告诉缓存行
   //如果指定了告诉缓存行的大小可以简写成这样
   //假设sizeof(DWORD) + 100 = 108；告诉缓存行大小为32
   //BYTE[12]；
   //作用呢就是强制下面的数据内容与上面数据内容不在同一高速缓存行中。
   CACHE_PAD(bPad1, sizeof(DWORD) + 100);

   int      nBalanceDue;      // Read-write
   FILETIME ftLastOrderDate;  // Read-write

   //Force the following structure to be in a different cache line.
   CACHE_PAD(bPad2, sizeof(int) + sizeof(FILETIME));
};