平方根倒数快速算法(中) --- 向Greg Walsh致敬!
在前面的介绍中,我们已经知道了这段代码的作者Greg Walsh在函数的最后使用了NR-iteration,且只用了一次NR-iteration就能达到比较理想的精度。这样一来,选择正确的初值就显得尤为重要了。而选择初始值的关键又在于充分的利用浮点数x在计算机中的表示/编码方式。
注意:为了便于行文顺畅,以及对照前后文看时不容易引起误解和混淆,我这里所有公式的编号都将延续上文公式的index。但会给这篇文章中的新公式给予新的index。本来这一系列的文章我最初都是放在一篇文章中写的,但那样的文章实在是太过于冗长,这才分成了上中下三篇。
1,计算机浮点数的二进制表示IEEE-754

在code中函数的输入number为一个float型的浮点数(注意:代码中的number就是我文中的x)。则根据标准IEEE 754,x的二进制浮点数表示如下(准确的说应该叫normal number的表示标准),其中,S表示符号位,E表示指数,T表示有效数字的尾数:

对中的开根号运算而言,x不可能是负数(负数没法进行开根号运算),所以默认符号位S恒为0。这样一来,浮点数x在计算机中的二进制可表示如下(其中:
和
专门用于特指浮点数x所对应的T字段和E字段):
在IEEE-754标准中,对于单精度float而言,精度p=24,指数部分的偏移量b=127,则:
,(式6)
2,二进制浮点数x的对数表达式 --- log2(x)
我们对x的二进制浮点数表示(式6)取以2为底的对数,得到:
,(式7)
使用整体替换,令:
,(式8)
把(式8)中的整体替换代入(式7)得到:
,(式9)
3,log2(1+M)的近似
根据IEEE-754的标准,T字段所保存的是trailing significand,即,放大一定精度后的有效数字的尾数或者说是放大一

最低0.47元/天 解锁文章
1212

被折叠的 条评论
为什么被折叠?



