微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

c – 分支或乘法更有效吗?

我正在尝试优化一个小的,高度使用的函数,该函数使用无符号short int中的高位来指示要一起求和的数组值.起初我使用下面显示的明显方法.请注意,循环展开未明确显示,因为它应由编译器完成.
int total = 0;
for(unsigned short mask = 0x0001,j = 0; mask != 0; mask <<= 1,j++){
    if (i & mask){
        total += value[j];
    }
}

但是,后来我认为删除分支以帮助cpu流水线操作可能会更好,并提出以下建议.

int total = 0;
for(unsigned short mask = 0x0001,j++){
    total += ((i & mask) != 0) * value[j];
}

请注意,由于(i& mask)不会产生布尔答案,因此与0的比较会强制结果为1或0.虽然第二种方法代码的这一部分中删除了if语句,但第二种解决方案除了等式的其余部分之外,还需要在每次迭代时运行0或1的乘法.

哪个代码运行得更快?

解决方法

如果没有乘法,你可以使它无分支.看起来对于每个位集,您使用该位位置作为数组的索引.

首先,您可以轻松提取设置的位:

unsigned short set_mask= i & -i;
i&= i - 1;

然后,您可以通过计算(set_mask – 1)中设置的位来获取位索引.这是一个恒定的时间公式.

某些平台也有一个内在函数获取位集的位索引,这可能更快. x86有bsr,PPC有cntlz.

所以答案是无分支无乘版本可能是最快的:)

原文地址:https://www.jb51.cc/c/117327.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐