我正在尝试计算大量uint64的位奇偶校验.比特奇偶校验是指接受uint64的函数,如果设置的比特数是偶数则输出0,否则为1.
目前我正在使用以下功能(@Troyseph,发现here):
uint parity64(uint64 n){ n ^= n >> 1; n ^= n >> 2; n = (n & 0x1111111111111111) * 0x1111111111111111; return (n >> 60) & 1; }
相同的SO页面具有以下汇编例程(由@papadp提供):
.code ; bool CheckParity(size_t Result) CheckParity PROC mov rax,0 add rcx,0 jnp jmp_over mov rax,1 jmp_over: ret CheckParity ENDP END
它利用了机器的parity flag.但我无法使用我的C程序(我知道旁边没有组装).
题.如何在C源文件中包含上面(或类似)代码作为内联汇编,以便使用parity64()函数来运行它?
(我在Intel Xeon Haswell上使用GCC和64位Ubuntu 14)
如果有任何帮助,可在以下例程中调用parity64()函数:
uint bindot(uint64* a,uint64* b,uint64 entries){ uint parity = 0; for(uint i=0; i<entries; ++i) parity ^= parity64(a[i] & b[i]); // Running sum! return parity; }
(这应该是场Z / 2Z上的两个向量的“点积”,即GF(2).)
解决方法
您将不得不使用扩展内联汇编(这是一个gcc扩展)来获得类似的效果.
您的parity64功能可以更改如下 –
uint parity64(uint64 n){ uint result = 0; __asm__("addq $0,%0" : : "r"(n) :); __asm__("jnp 1f"); __asm__("movl $1,%0" : "=r"(result) : : ); __asm__("1:"); return result; }
但正如@MichaelPetch评论的那样,奇偶校验标志仅在低8位上计算.因此,如果您的n小于255,这将适用于您.对于更大的数字,您将必须使用您在问题中提到的代码.
要使其工作在64位,您可以通过执行将32位整数的奇偶校验折叠为单字节
n = (n >> 32) ^ n; n = (n >> 16) ^ n; n = (n >> 8) ^ n;
您将不得不检查它对性能的影响.
我能得到的最优化的是
uint parity64(uint64 n){ unsigned char result = 0; n = (n >> 32) ^ n; n = (n >> 16) ^ n; n = (n >> 8) ^ n; __asm__("test %1,%1 \n\t" "setp %0" : "+r"(result) : "r"(n) : ); return result; }
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。