关于新旧版本的GCC对浮点数运算的一些行为(读《CS:APP》)

文章探讨了GCC编译器在处理浮点运算时的行为,特别是新旧版本之间的差异。通过《CS:APP》中的例子,展示了在Intel IA32处理器上,浮点数在寄存器和内存间的精度问题。实验结果显示,GCC的优化选项(-O2)和-float-store对浮点数比较的影响,并讨论了可能的原因。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

《CS:APP》第二章中说到GCC对浮点运算的一些处理方式,在Intel IA32的处理器中浮点数寄存器使用的是80位的扩展精度格式,而在GCC中float和double类型的浮点数长度为32和64。这就导致在浮点数寄存器向内存中写入数据的时候会产生精度丢失。书中的例子如下:

#include <stdio.h>

double recip(int denom)
{
return 1.0/(double) denom;
}

void do_nothing(){}

void test1(int denom)
{
double r1,r2;
int t1,t2;

r1=recip(denom);
r2=recip(denom);
t1=r1==r2;
do_nothing();
t2=r1==r2;
printf("test1 t1:r1 %f %c=r2 %f/n",r1,t1?'=':'!',r2);
printf("test1 t2:r1 %f %c=r2 %f/n",r1,t2?'=':'!',r2);
}

main()
{
test1(10);
}

 

按照书中描述的GCC的版本得出的结果应该是(没有试过)

test1 t1: r1 0.100000!=r2 0.100000

test1 t2: r1 0.100000==r2 0.100000

 

但是在我的系统下,gcc 版本 4.2.3 (Ubuntu 4.2.3-2ubuntu7),结果是

test1 t1: r1 0.100000==r2 0.100000

test1 t2: r1 0.100000==r2 0.100000

 

编译命令行选项不管带不带-O2都是一样的

应该是做过修改的版本,但是,做了怎样的修改呢

 

使用书中的第二个测试函数
void test2(int denom)
{
double r1;
int t1;
r1=recip(denom);
t1=r1==1.0/(double) denom;
printf("test2 t1:r1 %f %c=1.0/10.0/n",r1,t1?'=':'!');
}

 

在新版本的GCC中,

gcc 版本 4.2.3 (Ubuntu 4.2.3-2ubuntu7)

hell2pradise@hell2pradise-laptop:~$ gcc test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 !=1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -O2 test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0

hell2pradise@hell2pradise-laptop:~$ gcc -ffloat-store test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0

到底谁在内存中,谁在寄存器中?

 

当把test2()函数做一个修改

t1=r1==1.0/(double) denom;

改为

t1=r1==1.0/10.0;

的时候

 

hell2pradise@hell2pradise-laptop:~$ gcc test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -O2 test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 !=1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -ffloat-store test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0

 

先看未修改过的test2()的结果

使用-O2或者-ffloat-store优化之后相等了,这说明==运算符的左右两侧应该是相同精度的浮点数,即都是double型的,都是内存中的值了么?在语句

t1=r1==1.0/(double) denom;

之前加上

do_nothing();

结果也是一样的,看起来确实如此。

但是为什么加上do_nothing()的时候,不使用优化还是得不到相等呢?而两个变量之间的比较却是各种相等。

这时候看第二个结果

使用-O2的时候不相等了,而没有编译选项或者-ffloat-store的时候相等了。。而我们所做的只是从1.0/(double) denom;到1.0/10.0,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值