我试图为有效的平方根算法找到更多信息,这些算法很可能在FPGA上实现。已经找到了很多算法,但是哪个算法例如来自Intel或AMD?
所谓高效,是指它们要么速度很快,要么不需要太多内存。

编辑:我可能应该提一下,这个问题通常是浮点数,并且由于大多数硬件都实现了IEEE 754标准,其中该数字表示为:1个符号位,8位偏置指数和23位尾数。

谢谢!

最佳答案

不是一个完整的解决方案,但有几个要点。

我假设您在浮点中工作,因此请记住,浮点1是以尾数和指数形式存储的。由于有对数,平方根的指数将约为原始数的指数的一半。

然后,可以通过查找表对尾数进行近似,然后可以使用几次牛顿-拉普森回合来为LUT的结果提供一定的准确性。

大约8年以来我还没有实现任何类似的方法,但是我认为这是我的方法,并且能够在3或4个周期内获得结果。

关于math - 硬件执行平方根?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/8871541/

10-11 18:35