关于新旧版本的GCC对浮点数运算的一些行为（读《CS:APP》）_寄存器中计算不会丢失精度吗-优快云博客

本文链接：https://blog.youkuaiyun.com/hell2pradise/article/details/4729930

文章探讨了GCC编译器在处理浮点运算时的行为，特别是新旧版本之间的差异。通过《CS:APP》中的例子，展示了在Intel IA32处理器上，浮点数在寄存器和内存间的精度问题。实验结果显示，GCC的优化选项(-O2)和-float-store对浮点数比较的影响，并讨论了可能的原因。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

《CS:APP》第二章中说到GCC对浮点运算的一些处理方式，在Intel IA32的处理器中浮点数寄存器使用的是80位的扩展精度格式，而在GCC中float和double类型的浮点数长度为32和64。这就导致在浮点数寄存器向内存中写入数据的时候会产生精度丢失。书中的例子如下:

#include <stdio.h>

double recip(int denom)
{
return 1.0/(double) denom;
}

void do_nothing(){}

void test1(int denom)
{
double r1,r2;
int t1,t2;

r1=recip(denom);
r2=recip(denom);
t1=r1==r2;
do_nothing();
t2=r1==r2;
printf("test1 t1:r1 %f %c=r2 %f/n",r1,t1?'=':'!',r2);
printf("test1 t2:r1 %f %c=r2 %f/n",r1,t2?'=':'!',r2);
}

main()
{
test1(10);
}

按照书中描述的GCC的版本得出的结果应该是(没有试过)

test1 t1: r1 0.100000!=r2 0.100000

test1 t2: r1 0.100000==r2 0.100000

但是在我的系统下，gcc 版本 4.2.3 (Ubuntu 4.2.3-2ubuntu7)，结果是

test1 t1: r1 0.100000==r2 0.100000

test1 t2: r1 0.100000==r2 0.100000

编译命令行选项不管带不带-O2都是一样的

应该是做过修改的版本，但是，做了怎样的修改呢

使用书中的第二个测试函数
void test2(int denom)
{
double r1;
int t1;
r1=recip(denom);
t1=r1==1.0/(double) denom;
printf("test2 t1:r1 %f %c=1.0/10.0/n",r1,t1?'=':'!');
}

在新版本的GCC中，

gcc 版本 4.2.3 (Ubuntu 4.2.3-2ubuntu7)

hell2pradise@hell2pradise-laptop:~$ gcc -ffloat-store test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0

到底谁在内存中，谁在寄存器中?

当把test2()函数做一个修改

t1=r1==1.0/(double) denom;

改为

t1=r1==1.0/10.0;

的时候

hell2pradise@hell2pradise-laptop:~$ gcc test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -O2 test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 !=1.0/10.0
hell2pradise@hell2pradise-laptop:~$ gcc -ffloat-store test.c
hell2pradise@hell2pradise-laptop:~$ ./a.out
test1 t1:r1 0.100000 ==r2 0.100000
test1 t2:r1 0.100000 ==r2 0.100000
test2 t1:r1 0.100000 ==1.0/10.0