FPGA定点小数计算（Verilog版）第七篇——平方根倒数运算（使用John Carmack方法）

最新推荐文章于 2025-10-28 14:47:49 发布

转载最新推荐文章于 2025-10-28 14:47:49 发布 · 4.6k 阅读

AI助手已提取文章相关产品：

更多精彩内容，请微信搜索“FPGAer俱乐部”关注我们。

有一段时间没有写博客了，突然想起前一段时间挖的坑，所以决定今天来填一下……其实，这一篇原本打算写的是采用牛顿迭代法的平方根运算的博文，现在改为平方根倒数运算，很显然就是之前的尝试失败了……

为什么说是失败了呢？主要原因就是相比于其他的求平方根方法：CORDIC和查表法，我的方法（先求平方根倒数，再求倒数）并没有足够的优势。可能有人会问，你是不是傻，求平方根就求平方根，非要搞这么复杂干什么？其实，这里的平方根倒数运算采用的是John Carmack的改进方法，基本上只进行一次牛顿迭代就可以满足大部分场合的精度要求，大家可以看一下我之前转载的一篇博文：

http://blog.chinaaet.com/justlxy/p/5100052325

事实证明，用Verilog语言设计的模块最终也达到了预期的理想效果（具体后面再说）。但是，问题出在除法上面，由于除法采用的是移位法（可以看一下我之前写的一篇整数的除法运算，小数的除法要比这个复杂一点：http://blog.chinaaet.com/justlxy/p/5100052068），如果采用迭代运算的方式，的确也用不了多少资源，但是运行速度（时钟速度）确难以提升上去，如果进行Pipelining的话，需要大量的触发器资源和LUT资源……想了好久也没有找到比较好的定点小数除法（或者求倒数）的实现方案，所以只能暂时放弃之前的想法了……如果有哪位有比较好的方法的，肯请赐教！感激不尽！

但是，忙活了这么多天了，还是有点成果的，所以就算把关于平方根倒数计算的设计整理一下，写一篇博文与大家分享一下。其实这个设计早就写好了，在前面几篇博文内容的基础上实现的平方根倒数计算的效果并不太好，花费了差不多1K的LUT和24个乘法器，最终只能运行到50MHz多一点的水平，实在不能忍了，所以又花了几天时间把所有的设计全部Pipelining了一遍，目前的实现效果如下：