我正在研究Nehalam/westmere英特尔微体系结构CPU。我想针对该架构优化我的代码。 GCC是否有任何专门的编译标志或C函数可帮助我提高代码的运行时性能?
我已经在使用-o3。
Language of the Code - C
Platform - Linux
GCC Version - 4.4.6 20110731 (Red Hat 4.4.6-3) (GCC)
在我的代码中,我进行了一些浮点比较,并且完成了一百万次以上。
请假设代码已经过最佳优化。
最佳答案
警告:答案不正确。
您实际上可以自己分析所有禁用和启用的优化。在您的计算机上运行:
gcc -O3 -Q --help=optimizers | grep disabled
然后阅读有关仍被禁用并且可以根据the gcc documentation影响性能的标志。
关于c - 针对特定CPU架构进行优化的GCC选项,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/10646894/