《CS:APP》第二章中说到GCC对浮点运算的一些处理方式,在Intel IA32的处理器中浮点数寄存器使用的是80位的扩展精度格式,而在GCC中float和double类型的浮点数长度为32和64。这就导致在浮点数寄存器向内存中写入数据的时候会产生精度丢失。书中的例子如下:
#include <stdio.h>
double recip(int denom)
{
return 1.0/(double) denom;
}
void do_nothing(){}
void test1(int denom)
{
double r1,r2;
int t1,t2;
r1=recip(denom);
r2=recip(denom);
t1=r1==r2;
do_nothing();
t2=r1==r2;
printf("test1 t1:r1 %f %c=r2 %f/n",r1,t1?'=':'!',r2);
printf("test1 t2:r1 %f %c=r2 %f/n",r1,t2?'=':'!',r2);
}
main()
{
test1(10);
}
按照书中描述的GCC的版本得出的结果应该是(没有试过)
test1 t1: r1 0.100000!=r2 0.100000
test1 t2: r1 0.100000==r2 0.100000
但是在我的系统下,gcc 版本 4.2.3 (Ubuntu 4.2.3-2ubuntu7),结果是
test1 t1: r1 0.100000==r2 0.100000
test1 t2: r1 0.100000==r2 0.100000
编译命令行选项不管带不带-O2都是一样的
应该是做过修改的版本,但是,做了怎样的修改呢
使用书中的第二个测试函数
void test2(int denom)
{
double r1;
int t1;
r1=recip(denom);
t1=r1==1.0/(double) denom;
printf("test2 t1:r1 %f %c=1.0/10.0/n",r1,t1?'=':'!');
}
在新版本的GCC中,
gcc 版本 4.2.3 (Ubuntu 4.2.3-2ubuntu7)
hell2pradise@hell2pradise-laptop:~$ gcc test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 !=1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -O2 test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -ffloat-store test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0
到底谁在内存中,谁在寄存器中?
当把test2()函数做一个修改
t1=r1==1.0/(double) denom;
改为
t1=r1==1.0/10.0;
的时候
hell2pradise@hell2pradise-laptop:~$ gcc test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -O2 test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 !=1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -ffloat-store test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0
先看未修改过的test2()的结果
使用-O2或者-ffloat-store优化之后相等了,这说明==运算符的左右两侧应该是相同精度的浮点数,即都是double型的,都是内存中的值了么?在语句
t1=r1==1.0/(double) denom;
之前加上
do_nothing();
结果也是一样的,看起来确实如此。
但是为什么加上do_nothing()的时候,不使用优化还是得不到相等呢?而两个变量之间的比较却是各种相等。
这时候看第二个结果
使用-O2的时候不相等了,而没有编译选项或者-ffloat-store的时候相等了。。而我们所做的只是从1.0/(double) denom;到1.0/10.0,