gcc中的优化选项-O
内容摘⾃
⼀般来说,如果不指定优化标识的话,gcc就会产⽣可调试代码,每条指令之间将是独⽴的:可以在指令之间设置断点,使⽤gdb中的 p命令查看变量的值,改变变量的值等。并且把获取最快的编译速度作为它的⽬标。
当优化标识被启⽤之后,gcc编译器将会试图改变程序的结构(当然会在保证变换之后的程序与源程序语义等价的前提之下),以满⾜某些⽬标,如:代码⼤⼩最⼩或运⾏速度更快(只不过通常来说,这两个⽬标是⽭盾的,⼆者不可兼得)。
在不同的gcc配置和⽬标平台下,同⼀个标识所采⽤的优化种类也是不⼀样的,这可以使⽤-Q --help =optimizers来获取每个优化标识所启⽤的优化选项。
下⾯每个-f**优化标识都可以在上述链接中找到解释
1.-O,-O1:
这两个命令的效果是⼀样的,⽬的都是在不影响编译速度的前提下,尽量采⽤⼀些优化算法降低代码⼤⼩和可执⾏代码的运⾏速度。并开启如下的优化选项:
-fbranch-count-reg
-fcombine-stack-adjustments
-fcompare-elim
-fcprop-registers
关于动物的英语谚语
-fdce
-fdefer-pop
-fdelayed-branch
-fd
-fforward-propagate
-fguess-branch-probability
-fif-conversion2
-
fif-conversion
-finline-functions-called-once
-fipa-pure-const
-fipa-profile
-fipa-reference
-fmerge-constants
-fmove-loop-invariants
-freorder-blocks
-fshrink-wrap
-fshrink-wrap-parate
-fsplit-wide-types
-
fssa-backprop
-fssa-phiopt
-fstore-merging
-ftree-bit-ccp
-ftree-ccp
-ftree-ch
-ftree-coalesce-vars
打电话销售技巧-ftree-copy-prop
什么是有价证券
-ftree-dce
-ftree-dominator-opts
-ftree-d
-
ftree-forwprop
-ftree-fre
-ftree-phiprop
-ftree-sink
-ftree-slsr
-ftree-sra
-ftree-pta
-ftree-ter
-funit-at-a-time
2. -O2
该优化选项会牺牲部分编译速度,除了执⾏-O1所执⾏的所有优化之外,还会采⽤⼏乎所有的⽬标配置⽀持的优化算法,⽤以提⾼⽬标代码的运⾏速度。
-falign-functions -falign-jumps
-falign-loops -falign-labels
-fcaller-saves
-fcrossjumping
船务英语
-fc-follow-jumps -fc-skip-blocks
-fdelete-null-pointer-checks
-fdevirtualize -fdevirtualize-speculatively
-fexpensive-optimizations
-fgc -fgc-lm
-fhoist-adjacent-loads
-finline-small-functions
-
findirect-inlining
-fipa-cp
-fipa-cp-alignment
-fipa-bit-cp
-fipa-sra
-fipa-icf
-fisolate-erroneous-paths-dereference
-flra-remat
-foptimize-sibling-calls
-foptimize-strlen
-fpartial-inlining
-
computer怎么读
fpeephole2
-freorder-blocks-algorithm=stc
-freorder-blocks-and-partition -freorder-functions
-frerun-c-after-loop
二言目-fsched-interblock -fsched-spec
-fschedule-insns -fschedule-insns2
-fstrict-aliasing -fstrict-overflow
-ftree-builtin-call-dce
-ftree-switch-conversion -ftree-tail-merge
-fcode-hoisting
-ftree-pre
英文字幕网-
ftree-vrp
-fipa-ra
3. -O3
该选项除了执⾏-O2所有的优化选项之外,⼀般都是采取很多向量化算法,提⾼代码的并⾏执⾏程度,利⽤现代CPU中的流⽔线,Cache 等。
-finline-functions // 采⽤⼀些启发式算法对函数进⾏内联
-funswitch-loops // 执⾏循环unswitch变换
-fpredictive-commoning //
-fgc-after-reload //执⾏全局的共同⼦表达式消除
-ftree-loop-vectorize //
-ftree-loop-distribute-patterns
-fsplit-paths
-ftree-slp-vectorize
-fvect-cost-model
-ftree-partial-pre
-fpeel-loops
一无所有英文-fipa-cp-clone options
这个选项会提⾼执⾏代码的⼤⼩,当然会降低⽬标代码的执⾏时间。
4. -Os
这个优化标识和-O3有异曲同⼯之妙,当然两者的⽬标不⼀样,-O3的⽬标是宁愿增加⽬标代码的⼤⼩,也要拼命的提⾼运⾏速度,但是这个选项是在-O2的基础之上,尽量的降低⽬标代码的⼤⼩,这对于存储容量很⼩的设备来说⾮常重要。
为了降低⽬标代码⼤⼩,会禁⽤下列优化选项,⼀般就是压缩内存中的对齐空⽩(alignment padding)
-falign-functions
-falign-jumps
-falign-loops
-falign-labels
2786-freorder-blocks
-freorder-blocks-algorithm=stc
-freorder-blocks-and-partition
-fprefetch-loop-arrays
5. -Ofast:
旁蒂克该选项将不会严格遵循语⾔标准,除了启⽤所有的-O3优化选项之外,也会针对某些语⾔启⽤部分优化。如:-ffast-math ,对于Fortran 语⾔,还会启⽤下列选项:
-fno-protect-parens
-fstack-arrays
6.-Og:
该标识会精⼼挑选部分与-g选项不冲突的优化选项,当然就能提供合理的优化⽔平,同时产⽣较好的可调试信息和对语⾔标准的遵循程度。