我正在研究Nehalam/westmere英特尔微体系结构CPU。我想针对该架构优化我的代码。 GCC是否有任何专门的编译标志或C函数可帮助我提高代码的运行时性能?

我已经在使用-o3。

Language of the Code - C
Platform - Linux
GCC Version - 4.4.6 20110731 (Red Hat 4.4.6-3) (GCC)

在我的代码中,我进行了一些浮点比较,并且完成了一百万次以上。

请假设代码已经过最佳优化。

最佳答案

警告:答案不正确

您实际上可以自己分析所有禁用和启用的优化。在您的计算机上运行:

gcc -O3 -Q --help=optimizers | grep disabled

然后阅读有关仍被禁用并且可以根据the gcc documentation影响性能的标志。

关于c - 针对特定CPU架构进行优化的GCC选项,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10646894/

10-11 18:40