C++编程时减少CPU分支预测错误措施

2013年6月3日 由 Creater 留言 »

利用Intel的vtune测试Hardware Issue选项可以看到分支预测的情况。
一般来讲

95%的分支预测成功是正常的
90%表示还有提高的空间
75%表示非常糟糕

如何提高分支预测的效率, 下面列举了一些特例表示可以考虑的优化方向
case 1

if(t1==0&&t2==0&&t3==0) {
// do something
}

====>
// 合并条件,提高分支预测成功率

if(t1|t2|t3==0){ 
// do something
}

case 2

for(int i=0; i<1000; ++i){  // for cpu 密集调用
   if(cond) // 分支预测
     do();
   else 
      do2();
}

==============》

if(cond){  // 避免了CPU密集调用时进行分支预测
   if(int i=0; i<1000; ++i)   do();
}else{
   if(int i=0; i<1000; ++i)  do1();
}

case 3

for(int i=0; i<10000; ++i){  // 此时要进行多次分支预测
if(a<10){
 		fun1();
}else(a<25){
		fun2();
}else{a<50}{
		fun3();
}else{
		fun4();
}
}

==========》

typedef void(*Func)();
Func funarray[n];  // 利用函数指针数组来避免多次运行时候的分支预测
Funarray[1] = &fun1;
…

for(int i=0; i<10000; ++i){
	funarray[a]();
}

case 4:

if(color<0)  color=0;

================⇒

color &=~(color>>31);  // 注: 右移 负数补1 正数补0
广告位

发表评论

你必须 登陆 方可发表评论.