《算法》计算最佳缓冲区大小

最新推荐文章于 2023-07-03 07:42:29 发布

原创最新推荐文章于 2023-07-03 07:42:29 发布 · 2.5k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#算法

算法专栏收录该内容

3 篇文章

订阅专栏

本文探讨了如何通过优化算法减少I/O操作，尤其是使用缓冲区来提高性能。重点介绍了Win32API函数QueryPerformanceFrequency()，用于获取硬件计数器频率，帮助精确测量算法运行时间。实验结果显示，缓冲区大小设为1024时已达到最优性能，进一步增大缓冲区并不会提升性能。

前言

对算法进行改进以求获得最佳的性能通常有两种策略：优化现有的算法，或者开发新的算法。

优化算法的标准技术：
1、使I/O减到最少，减少函数调用的次数，限制计算密集型操作（浮点数运算和除法运算）；
2、确定执行得最频繁的算法元素，比如冒泡排序的比较和交换；
3、检查可能由于疏忽导致而导致特别缓慢的的实现。这往往与查找最坏情况相似。

I/O通常是发生在毫秒(ms)级的时间范围内，而CPU的活动一般发生在亚微秒级的范围内。因此对于算法而言，任何I/O的代价都非常高昂。
如果不能消除I/O本身，那么可以使用缓冲区来减小它的影响。

代码

下面的一个算法，就是用来测试从输入文件流infile向输出文件流outfile传输时，多少大小的缓冲区buf最合适(既可以速度达到最快，也不浪费存储空间)

#include <stdio.h>
#include <stdlib.h>
#include <limits.h>
#include <Windows.h>

#undef CopyFile//取消以前定义的CopyFile（下面有重写的CopyFile()）  
#pragma comment(lib, "kernel32.lib")//yyw  

#define DEF_BUF 512  

long GetCPUTime() 
{
    static LARGE_INTEGER li = {0};  //静态变量~~初始化一次
    LARGE_INTEGER linow = {0};

    if ( 0 == li.QuadPart)
    {
        QueryPerformanceFrequency(&li);
    }
    QueryPerformanceCounter(&linow);

    return linow.QuadPart*1000/li.QuadPart;
}

#define get_clock_ticks(x) \
    x = GetCPUTime()

long CopyFile( char *inFileName, char *outFileName,size_t insize,size_t outsize)
{
    int c;
    long starttime, donetime;
    FILE *infile = NULL, *outfile = NULL;

    if ( (infile = fopen(inFileName,"rb")) == NULL )
    {
        printf("Can't open %s\n",inFileName);
        exit(1);
    }

    if ( setvbuf(infile,NULL,_IOFBF,insize))
    {
        printf("counld't set infile buffer to %u bytes\n",insize);
        exit(1);
    }

    if ( (outfile = fopen(outFileName,"wb")) == NULL )
    {
        printf("can't open %s\n",outFileName);
        exit(1);
    }

    if ( setvbuf(outfile,NULL,_IOFBF,outsize) )
    {
        printf("counld't set outfile buffer to %u bytes\n",insize);
        exit(1);
    }

    get_clock_ticks(starttime);
    while( (c = fgetc(infile)) != EOF )
    {
        fputc(c,outfile);
    }
    get_clock_ticks(donetime);
    fclose(infile);
    fclose(outfile);
    return (donetime - starttime);
}







int main(int argc , char *argv[])
{
    size_t insize, outsize;
    int i;
    long total, average, lo, hi, elapsed;
    insize = outsize = DEF_BUF;

    if ( argc <3 || argc > 5 )
    {
        fprintf(stderr,"Usage infire!!!!!\n");
        return (EXIT_FAILURE);
    }

    if ( argc > 3)
    {
        insize = (unsigned)atoi(argv[3]);
    }
    if ( argc > 4 )
    {
        outsize = (unsigned)atoi(argv[4]);
    }

    total = hi = 0;
    lo = LONG_MAX;
    for ( i = 1; ; ++i)
    {
        elapsed = CopyFile(argv[1],argv[2],insize,outsize);

        if ( elapsed > hi)
        {
            hi = elapsed;
        }

        if ( elapsed < lo)
        {
            lo = elapsed;
        }

        total += elapsed;

        if ( total > 500 || i > 4)
        {
            break;
        }
    }

    average = total/i;

    FILE *result = NULL;
    result = fopen("result.txt","ab");
    if ( NULL == result )
    {
        exit(EXIT_FAILURE);
    }
    fprintf(result,"Average of %4ld ticks (%4ld - %4ld).Insize = %5u. Outsize = %5u.\n",
        average, lo, hi, insize, outsize );

    return ( EXIT_SUCCESS );  


}

关键函数

QueryPerformanceFrequency() - 基本介绍

类型：Win32API
原型：BOOL QueryPerformanceFrequency(LARGE_INTEGER *lpFrequency);
作用：返回硬件支持的高精度计数器的频率。
返回值：非零，硬件支持高精度计数器；零，硬件不支持，读取失败。

QueryPerformanceFrequency() - 技术特点

供WIN9X使用的高精度定时器：QueryPerformanceFrequency()和QueryPerformanceCounter()，要求计算机从硬件上支持高精度定时器。
函数的原形是：
　　BOOL QueryPerformanceFrequency(LARGE_INTEGER *lpFrequency);
　　BOOL QueryPerformanceCounter (LARGE_INTEGER *lpCount);
数据类型LARGEINTEGER既可以是一个作为8字节长的整数，也可以是作为两个4字节长的整数的联合结构，其具体用法根据编译器是否支持64位而定。该类型的定义如下：
　　typeef union _ LARGE_INTEGER
　　{
　　 struct
　　 {
　　 DWORD LowPart;
　　 LONG HighPart;
　　 };
　　 LONGLONG QuadPart;
　　} LARGE_INTEGER;
在定时前应该先调用QueryPerformanceFrequency()函数获得机器内部计时器的时钟频率。接着在需要严格计时的事件发生前和发生之后分别调用QueryPerformanceCounter()，利用两次获得的计数之差和时钟频率，就可以计算出事件经历的精确时间。

运行结果

这里写图片描述

运行结果的图使用Python解析所获取的结果所画！
python代码如下：

import string
import matplotlib.pyplot as plt  
import numpy as np
import re

if __name__ == '__main__':   

     size = []
     time = []

     file = open(r'result.txt','r')
     lineList = file.readlines()
     for element in lineList:
         m = re.findall(r'(\w*[0-9]+)\w*', element)
         #print(m)
         time.append(m[0])
         size.append(m[3])

     #print(size)
     #print(time)

     plt.plot(size, time, 'b*')
     plt.plot(size, time, 'r')

     plt.ylim(0, 100)
     plt.xlim(0,2058)
     plt.title('Better Bufsize')
     plt.legend()
     plt.show()