小内存复制提速: 防止编译为memcpy

    int x, y;
    char buff_output[100], buff_input[100];
    scanf("%d", &x);
    scanf("%d", &y);
    //--------------------------------
    for (int i = x / 4, end = (y + 3) / 4; 
        i < end; 
        ++i)    
    {   // 对未知的区间(假设是4字节对齐),按uint32复制
        ((uint32_t*)buff_output)[i] = ((uint32_t*)buff_input)[i];
    }
    //--------------------------------
    puts(buff_output);

类似的循环,gcc和vs经编译都会形成memcpy的调用
在这里插入图片描述
但如果终点和起点非常节点,则调用memcpy得不偿失性能较慢。
改用如下代码,可以强迫编译器放弃memcpy,性能可能会提速一倍

    int x, y;
    char buff_output[100], buff_input[100];
    scanf("%d", &x);
    scanf("%d", &y);
    //--------------------------------
    for (int i = x / 4, end = (y + 3) / 4; 
        i < end; 
        ++i)    
    {   // 对未知的区间(假设是4字节对齐),按uint32复制
        // 加上volatile
        ((volatile uint32_t*)buff_output)[i] = ((uint32_t*)buff_input)[i];
    }
    //--------------------------------
    puts(buff_output);

但我们直到如果使用了volatile,就会导致一些编译器优化链断开,对最终性能未必是好事。

    int x, y;
    char buff_output[100], buff_input[100];
    scanf("%d", &x);
    scanf("%d", &y);
    //--------------------------------
    for (uint32_t i = x &~ 3 /*在这里修改x可以让编译器不那么确定范围*/, end = y; i < end; i += 4)
    {
        *(uint32_t*)(buff_output + i) = *(uint32_t*)(buff_input + i);
    }
    //--------------------------------
    puts(buff_output);

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值