技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

在C中使用内联汇编进行位奇偶校验？

时间：2020-08-21分类：C&C++作者：编程之家

我正在尝试计算大量uint64的位奇偶校验.比特奇偶校验是指接受uint64的函数,如果设置的比特数是偶数则输出0,否则为1.

目前我正在使用以下功能(@Troyseph,发现here)：

uint parity64(uint64 n){
  n ^= n >> 1;
  n ^= n >> 2;
  n = (n & 0x1111111111111111) * 0x1111111111111111;
  return (n >> 60) & 1;
}

相同的SO页面具有以下汇编例程(由@papadp提供)：

.code

; bool CheckParity(size_t Result)
    CheckParity PROC
    mov     rax,0
    add     rcx,0
    jnp     jmp_over
    mov     rax,1
jmp_over:
    ret
CheckParity ENDP

END

它利用了机器的parity flag.但我无法使用我的C程序(我知道旁边没有组装).

题.如何在C源文件中包含上面(或类似)代码作为内联汇编,以便使用parity64()函数来运行它？

(我在Intel Xeon Haswell上使用GCC和64位Ubuntu 14)

如果有任何帮助,可在以下例程中调用parity64()函数：

uint bindot(uint64* a,uint64* b,uint64 entries){
    uint parity = 0;

    for(uint i=0; i<entries; ++i)
      parity ^= parity64(a[i] & b[i]);  // Running sum!

    return parity;
}

(这应该是场Z / 2Z上的两个向量的“点积”,即GF(2).)

解决方法

您将不得不使用扩展内联汇编(这是一个gcc扩展)来获得类似的效果.

您的parity64功能可以更改如下 –

uint parity64(uint64 n){
    uint result = 0;
    __asm__("addq $0,%0" : : "r"(n)  :);
    __asm__("jnp 1f");
    __asm__("movl $1,%0" : "=r"(result) : : );
    __asm__("1:");
    return result;
}

但正如@MichaelPetch评论的那样,奇偶校验标志仅在低8位上计算.因此,如果您的n小于255,这将适用于您.对于更大的数字,您将必须使用您在问题中提到的代码.

要使其工作在64位,您可以通过执行将32位整数的奇偶校验折叠为单字节

n = (n >> 32) ^ n;
n = (n >> 16) ^ n;
n = (n >> 8) ^ n;

此代码必须位于程序集之前的函数的开头.

您将不得不检查它对性能的影响.

我能得到的最优化的是

uint parity64(uint64 n){
    unsigned char result = 0;
    n = (n >> 32) ^ n;
    n = (n >> 16) ^ n;
    n = (n >> 8) ^ n;
    __asm__("test %1,%1 \n\t"
            "setp %0"
            : "+r"(result)
            : "r"(n)
            :
    );
    return result;
}

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 dio@foxmail.com 举报，一经查实，本站将立刻删除。

上一篇：关于C编程中的.c文件和.h文件？下一篇：c – CMake：C和CXX编译器识别未知

相关推荐

宿舍管理系统——单链表+结构体实现入住、退房和查询功能（C语言版）

本程序的编译和运行环境如下（如果有运行方面的问题欢迎在评论区留言，也欢迎直接加QQ：2961439733，备注博客园或CSDN即可）：编辑工具：Dev-C++（版本：5.11.0.0）编译器：TDM-GCC 4.9.2 64-bit Release 代码生成语言标准：ISO

作者：小柒w 时间：2024-09-27

使用Windows API 编写按行分配的计算矩阵向量相乘的并行程序

水了一学期的院选修，万万没想到期末考试还有比较硬核的编程题，居然还涉及到多线程了，而且是调用Windows接口函数写多线程。虽然学汇编的时候有所了解，但毕竟没尝试过，思来想去，写出了下面的蹩脚代码，不足之处还望各位批评指正。题目描述如下：采用windows接口函数，编写一个计算矩阵向量相乘的并行程

作者：小柒w 时间：2024-09-27

C语言实现一个走迷宫小游戏（深度优先算法）

补充一下，先前文章末尾给出的下载链接的完整代码含有部分C++的语法（使用Dev-C++并且文件扩展名为.cpp的没有影响），如果有的朋友使用的语言标准是VC6的话可能不支持，所以在修改过后再上传一版，这次直接放在文章末尾了，复制粘贴就行，希望对您有所帮助。接上一篇万年历博文，还是那位朋友的练习题。

作者：小柒w 时间：2024-09-27

模N取余法实现大整数进制转换 ——C语言版（2-16进制均可）

思路如标题所说采用模N取余法，难点是这个除法过程如何实现。个人推荐先到这篇博客学习一下，大佬的思路就是不一样：大数除法——超详细讲解我所做的就是在上面博文代码的基础上增加了循环，用一个字符数组逆序存储余数，最后再逆序输出就得到了正确结果。具体代码及注释如下，目前我本人测试无误，能够正确运行。如果

作者：小柒w 时间：2024-09-27

C语言输出格式工整的日历——2乘6样式（详见本文）

本篇博客有更新！！！更新后效果图如下：文章末尾的完整代码如不能在Dev-C++上完好运行，出现如下问题： E:\Dev-Cpp\源代码\万年历.c [Error] 'for' loop initial declarations are only allowed in C99 or

作者：小柒w 时间：2024-09-27

通过调试来理解形参与实参的区别

刚开始学习模块化程序设计时，估计大家都被形参和实参搞迷糊过，尤其是遇到形参名和实参名一样时，更加晕头转向，出现一种“是谁把值传给了我，而我又传给了谁”的疑惑。我也有过类似的迷茫，更是被其他初学的同学问过很多次。想了好久还是决定整理一下，把它写成博客供更多人学习，而且是通过调试这一种直观的方式。下面进

作者：小柒w 时间：2024-09-27

C# Task 实现任务超时取消、超时取消然后重试超过重试最大次数就结束。

任务超时取消示例 public static async Task TimeoutCancelTask() { CancellationTokenSource cts = new CancellationTokenSource();//取消令牌 Task task = DoAction(cts);

作者：Net开发-孔明时间：2024-09-27

### 1.计时器类Stopwatch ``` Stopwatch stopwatch=new Stopwatch() stopwatch.Start();//开始计时 stopwatch.Stop();//停止计时 stopwatch.Reset();//重置计时时间 stopwatch.Rest

作者：Net开发-孔明时间：2024-09-27

MindSpore自定义算子中的张量维度问题

当我们使用GPU进行快速运算时，虽然可以用成熟的深度学习框架如MindSpore和PyTorch等进行实现，但其实从速度上来说，最快不过直接使用C/C++的CUDA来实现。也正是因为如此，在MindSpore框架中支持了对CUDA实现的算子的直接调用，只是在格式规范上有一定的要求。本文主要介绍Min

作者：DECHIN 时间：2024-09-25

CUDA指针数组Kernel函数

继上一篇文章学习使用C++存储一个不规则二维数组之后，这里介绍如何在C语言版的CUDA中实现一个不规则的二维数组。总体的实现思路跟前面一篇文章一样，使用了一个二维的指针数组来存储。其中主要的不同点大概就是在Host和Device之间的内存交互上，需要不断的分配、拷贝和释放内存，最终我们还是用一个CU

作者：DECHIN 时间：2024-09-25

小编推荐

苹果市值2025年有望达4万亿美元