排查GCC 4.4.X版本优化switch-enum的BUG
2021-07-04 17:06
标签:证明 假设 代码 efault 情况下 优化 改变 定义 statement 一次偶然碰到一个诡异的bug,现象是同一份C++代码使用GCC4.4.x版本在开启优化前和优化后的结果不一样,优化后的代码逻辑不正确。 示例代码如下: 将这段代码分别使用 考虑到是有enum存在,可能是枚举超出定义范围而被GCC优化掉了,在网上找到一篇帖子,大意是讲enum是以int类型存储的,同时32bit在cpu中有更快的处理效率。 通过单步调试和watch命令也会发现tt的值一直是4,且没有被更改,因此可以排除enum undefined这种情况。 于是只能去看汇编代码了,事实证明这才是最有效的方式,比自己瞎猜要节省时间。 对比下debug(上)和release(下)两种情况下的汇编代码。 可以看到在 出错的原因就在于开启编译优化后,GCC对大于零的情况默认其为case C(1),这里推测是由于 如此诡异的问题虽然找到了原因,但内心还是无法接受这是GCC犯的错误。 最后,解决这个问题的方法有两种,在switch之前做一次enum的范围检查,或者使用更高版本GCC。 最后的最后,附一个查询资料时看到的关于GCC对switch做的优化... 原文地址:https://lidawn.github.io/2018/09/02/gcc-bug/ 排查GCC 4.4.X版本优化switch-enum的BUG 标签:证明 假设 代码 efault 情况下 优化 改变 定义 statement 原文地址:https://www.cnblogs.com/lidawn/p/9613281.html起因
//main.cpp
#include
g++ -O0
和 g++ -O1
编译,结果让人诧异,在tt=4的时候,switch却跳到了1的分支。$ g++ -O0 -g -o main main.cpp
$ ./main
case default, tt = 4
case ERR_C, tt = 1
case default, tt = -4
$ g++ -O1 -g -o main main.cpp
$ ./main
case ERR_C, tt = 1
case ERR_C, tt = 1
case default, tt = -4
排查过程
可以通过调试时使用disas
命令查看汇编代码,也可以使用objdump
直接看二进制的汇编代码。# 未开启优化
(gdb) b 26
Breakpoint 1 at 0x400620: file main.cpp, line 26.
(gdb) r
...
(gdb) n
27 func(tt);
(gdb) s
func (tt=4) at main.cpp:10
10 switch(tt){
(gdb) disas /m
Dump of assembler code for function func(Type):
9 void func(Type tt){
0x00000000004005a4 : push %rbp
0x00000000004005a5 : mov %rsp,%rbp
0x00000000004005a8 : sub $0x10,%rsp
0x00000000004005ac : mov %edi,-0x4(%rbp)
10 switch(tt){
=> 0x00000000004005af : mov -0x4(%rbp),%eax
0x00000000004005b2 : test %eax,%eax
0x00000000004005b4 : je 0x4005d6
# 开启O1优化选项
(gdb) b 26
Breakpoint 1 at 0x400611: file main.cpp, line 26.
(gdb) r
...
(gdb) n
case ERR_C, tt = 1
29 func(tt);
(gdb) s
func (tt=ERR_C) at main.cpp:9
9 void func(Type tt){
(gdb) disas /m
Dump of assembler code for function func(Type):
9 void func(Type tt){
=> 0x00000000004005a4 : sub $0x8,%rsp
10 switch(tt){
0x00000000004005a8 : test %edi,%edi
0x00000000004005aa : je 0x4005cb
O0
时,汇编逻辑为:等于0时跳到case B,等于1跳到了case C,不等于-1跳到default, 等于-1到case A。
而在O1
时,汇编逻辑为: 等于0时跳到case B,大于0直接跳到了case C,不等于-1跳到default, 等于-1到case A。test
是使用位运算,而cmp
是使用加减运算,使用test提高了运算效率。 但是这种改变代码逻辑,让逻辑出错的优化显然是让人难以接受的。官方解释
经过谷歌一番,找到了这篇帖子, 果然有人也踩到了同样的坑。
这是一个GCC4.4版本被反馈过的bug,尽管这个优化很不合理,但依然被作为一个"feature"被保留下来...
在高版本GCC中,使用-std=c++03 -fstrict-enum
选项可以开启这个"特性",该特性假设编程者会保证enum的取值在其定义范围内。其他
参考
文章标题:排查GCC 4.4.X版本优化switch-enum的BUG
文章链接:http://soscw.com/essay/101813.html