如何解决是否有类似于 _mm256_mulhi_epu16 的 AVX、AVX2 或 AVX512 函数,但适用于 8 位?
本质上,我需要的是“_mm256_mulhi_epu8”(看起来并不存在),这会
“将 a 和 b 中的压缩无符号 8 位整数相乘,产生中间 16 位整数,并将中间整数的高 8 位存储在 dst 中。”
有没有办法用 x86 上的任何 256 位或 512 位指令集做到这一点?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。