quake3源代码学习--Q_fabs函数测试

本文通过对比不同实现方式的浮点数绝对值计算,包括直接比较和位操作的方法,展示了在特定环境下硬件级别优化所带来的性能提升。实验结果显示,使用位操作的内联函数在某些情况下能显著减少计算时间。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

学习一下硬件级别的优化,测试结果和Q_rsqrt类似,非常奇怪,不解。

测试代码如下:

#include <stdio.h>
#include <time.h>

float Q_fabs( float f ) {
 int tmp = * ( int * ) &f;
 tmp &= 0x7FFFFFFF;
 return * ( float * ) &tmp;
}
inline float Q_fabs_inline( float f ) {
 int tmp = * ( int * ) &f;
 tmp &= 0x7FFFFFFF;
 return * ( float * ) &tmp;
}
float fabs(float f)
{
 if(f < 0)
  return -f;
 else
  return f;
}
inline float fabs_inline(float f)
{
 if(f < 0)
  return -f;
 else
  return f;
}
double Q_fabs_double( double f ) {
 __int64 tmp = * ( __int64 * ) &f;
 tmp &= 0x7FFFFFFFFFFFFFFF;
 return * ( double * ) &tmp;
}
inline double fabs_double_inline( double f ) {
 if(f < 0)
  return -f;
 else
  return f;
}

int main(void)
{
 float f_1, f_t;
 long lCount_1, lCount_2, lCount_3, sum;
 time_t tStart, tEnd;

#define TestABS(func) /
 lCount_1 = sum+1;/
 tStart = clock();/
 while(--lCount_1){lCount_2 = sum+1;while(--lCount_2)f_t = func(f_1);}/
 tEnd = clock();/
 printf("sum=%d*%d,/tfunction:" #func ",/ttime:%d,/tresult=%f/n", sum, sum, (tEnd - tStart), func(f_1));

 sum = 10000;
 f_1 = -0.123;
 TestABS(Q_fabs);
 TestABS(Q_fabs_inline);
 TestABS(fabs);
 TestABS(fabs_inline);
 
 return 0;
}

测试结果:

sum=10000*10000,        function:Q_fabs,        time:801,       result=0.123000
sum=10000*10000,        function:Q_fabs_inline, time:0, result=0.123000
sum=10000*10000,        function:fabs,  time:981,       result=0.123000
sum=10000*10000,        function:fabs_inline,   time:0, result=0.123000 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值