如何解决如何使用 ARM NEON 内在函数将 u8 掩码转换为 u32 掩码?
有一个 uint8x8_t
掩码,从 vcgt_u8()
之类的内在函数获得,其值如下:
0,255,255
我想将此掩码转换为两个 uint32x4_t
类型的掩码。 vmovl_u8()
和 vmovl_u16()
似乎仍会保留 255 而不是 65535 和 4294967295。我该如何进行这种转换?
解决方法
像 vmovl_s
这样的有符号加宽操作会将像 255 这样的全 1 模式转换为 65535 等等,因此您需要 vreinterpret
将您的无符号向量转换为有符号,然后返回:
uint8x8_t v = ...;
int16x8_t i = vmovl_s8(vreinterpret_s8_u8(v));
uint32x4_t low = vreinterpretq_u32_s32(vmovl_s16(vget_low_s16(i)));
uint32x4_t high = vreinterpretq_u32_s32(vmovl_s16(vget_high_s16(i)));
,
添加几个 vmvnq_u32(vceqzq_u32(v))
调用即可。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。