GCC -o 优化选项说明

更新时间:2023-06-15 02:30:50 阅读: 评论:0

  GCC编译器优化选项分析及具体优化了什么 收藏
         
      起因:
      目前项目使用nios IDE作为开发平台,其使用的编译器为gcc的交叉编译器。在设定编译条件时,在debug模式下生成的程序正常,但是在relea模式下会出现LCD显示的开端显示不全,缺少一个字节或字的状况。为了了解具体为什么造成该问题,对两种模式下的配置做了对比,编译器皆为nios2-elf-gcc交叉编译器,debug模式编译器参数为:-DALT_DEBUG -O0 -g –Wall。relea模式编译器参数为: -DALT_RELEASE -O2 -g –Wall。
      两种模式下的参数简单说明如下
      -DALT_DEBUG:目前没有明确资料显示该项的具体作用,根据命名可认为与调试有关选项。且两种模式下都有,暂时认为不会造成差异。
      -O0: gcc编译器默认优化等级。
      -g:gdb调试器支持选项用于在编译时生成相关调试信息。
      -Wall:打开所有编译器告警选项,即编译器最严格告警模式。
      -O2:gcc编译高于O0低于O3的编译优化选项。
通过对比可以发现两种模式主要的不同在于编译器优化程度不同,那么编译器在两种优化下究竟做了什么优化那?是否由这些问题造成的显示丢失问题那??现在我们来看看gcc编译器的优化参数到底做了什么优化。(注:由于关于nios2-elf-gcc的文档资料十分稀少,不能形成可分析的文档,所以以通用的gcc作为分析,毕竟同出一源)
      正文:
GCC编译器优化选项介绍:
GCC编译器在目前是不是用最多的编译器也相去不远,尤其在嵌入式领域很多编译器都是基于GCC的cross gcc版本。毕竟功能成熟而且有开放的源代码。
这里只介绍优化编译的参数
-O用来开启优化编译选项。
-O0:默认模式,不做任何优化。
语序不当>放假通知
-O1:优化。该模式下对于一个大的函数或功能会花费更多的时间和内存。
            在-O1下:编译会尝试减少代码体积和代码运行时间。但是并不执行会花费大量时间的优化操作。
            在该模式下将打开一下优化选项:
              -fdefer-pop
 
怪开头的成语-fdelayed-branch
 
-fguess-branch-probability
 
-fcprop-registers
 
-floop-optimize
 
无聊的-fif-conversion
 
-fif-conversion2
 
-ftree-ccp
 
-ftree-dce
 
-ftree-dominator-opts
 
-ftree-d
 
-ftree-ter
 
-ftree-lrs
 
-ftree-sra
 
-ftree-copyrename
 
-ftree-fre
 
蜜粉是什么-ftree-ch
 
-funit-at-a-time
 
-fmerge-constants
韩国部队火锅
      该模式下在不影响调试的状况下还会打开‘-fomit-frame-pointer优化项。
平潭海鲜
      同时该模式不会为Ada编译器打开‘-ftree-sra’优化项,如需要则请使用命令参数输入‘-ftree-sra’进行优化。
-O2:进一步优化.GCC执行几乎所有支持的操作但不包括空间和速度之间权衡的优化。-O2优化等级下,并不执行循环展开和函数“内联”【注1】优化操作。与-O1比较该优化-O2将会花费更多的编译时间当然也会生成性能更好的代码。-O2除了打开-O1的所有优化参数外还打开以下优化选项。
      -fthread-jumps
-fcrossjumping
-foptimize-sibling-calls
-fc-follow-jumps -fc-skip-blocks
-fgc -fgc-lm
-fexpensive-optimizations
-fstrength-reduce
-frerun-c-after-loop -frerun-loop-o
-fcaller-saves
-fpeephole2
-fschedule-insns -fschedule-insns2
-fsched-interblock -fsched-spec
-fregmove
-fstrict-aliasing
-fdelete-null-pointer-checks
-freorder-blocks -freorder-functions
-falign-functions -falign-jumps
-falign-loops -falign-labels
-ftree-vrp
-ftree-pre
还要注意-fgc下关于请求-O2优化等级的用于计算goto的程序。
-O3:更进一步优化。-O3打开-O2指定的所有优化操作并且打开:
-finline-functions
-funswitch-loops
-fgc-after-reload
优化项。
-Os:针对程序空间大小优化(多用于嵌入式系统)。-Os使能-O2中除去会增加程序空间的所有优化参数。同时-Os还会执行更加优化程序空间的选项。
      -Os会关闭以下优化选项:
      -falign-functions
  -falign-jumps
  -falign-loops
  -falign-labels
  -freorder-blocks
  -freorder-blocks-and-partition
  -fprefetch-loop-arrays
  -ftree-vect-loop-version
      关于GCC编译的优化选项一共有-O0(默认),-O1,-O2,-O3及-Os五个参数。各个参数优选内容如上所示。但是各个优化内容到底是指什么那?继续分析。
      2.优化具体参数含义。(共计49项)
    -fdefer-pop
    推迟推出函数调用的参数,对于那些需要在函数调用后必须取出(pop)函数参数的机器而言,打开该项编译器将把函数调用的参数压入栈,等必要时几个函数调用参数一起取出(pop)。这将节省处理时间。
-fdelayed-branch
如果对目标机支持这个功能,它试图重新排列指令,以便利用延迟分支(delayed branch)指令后面的指令空隙.
-fguess-branch-probability
使用启发式算法预测分之指令,增加指令的命中率,提升运行效果。
-fcprop-registers
使用寄存器之间copy-propagation传值;
因为在函数中把寄存器分配给变量, 所以编译器执行第二次检查以便减少
  调度依赖性(两个段要求使用相同的寄存器)并且删除不必要的寄存器复制操作
-floop-optimize
  通过优化如何生成汇编语言中的循环, 编译器可以在很大程序上提高应用程序的性能。 通常, 程序由很多大型且复杂的循环构成。 通过删除在循环内没有改变值的变量赋值操作, 可以减少循环内执行指令的数量, 在很大程度上提高性能。 此外优化那些确定何时离开循环的条件分支, 以便减少分支的影响。
-fif-conversion 
if-then语句应该是应用程序中仅次于循环的最消耗时间的部分。
    简单的if-then语句可能在最终的汇编语言代码中产生众多的条件分支。 通过减少
日色    或者删除条件分支, 以及使用条件传送 设置标志和使用运算技巧来替换他们, 编译
    器可以减少if-then语句中花费的时间量。
-fif-conversion2 
这种技术结合更加高级的数学特性, 减少实现if-then语句所
    需的条件分支。
-ftree-ccp
Perform spar conditional constant propagation (CCP) on trees. This pass
only operates on local scalar variables and is enabled by default at ‘-O’  and
higher.
-ftree-dce
编译器将消除无用的不会被执行的代码(dead code)
-ftree-dominator-opts
Perform a variety of simple scalar cleanups (constant/copy propagation, redun-
dancy elimination, range propagation and expression simplification) bad on a
dominator tree traversal. This also performs jump threading (to reduce jumps
to jumps). This flag is enabled by default at ‘-O’ and higher.
-ftree-d
-ftree-ter
Perform temporary expression replacement during the SSA->normal pha. Sin-
gle u/single def temporaries are replaced at their u location with their defin-
ing expression. This results in non-GIMPLE code, but gives the expanders
much more complex trees to work on resulting in better RTL generation. This
is enabled by default at ‘-O’ and higher.

本文发布于:2023-06-15 02:30:50,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/82/956969.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:优化   编译器   参数
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图