微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用C中的SSE内在函数计算向量点积

我试图将两个向量相乘,一个向量的每个元素乘以另一个向量的同一索引中的元素.然后我想要求结果矢量的所有元素得到一个数字.例如,向量{1,2,3,4}和{5,6,7,8}的计算将如下所示:

1 * 5 2 * 6 3 * 7 4 * 8

本质上,我正在采取两个向量的点积.我知道有一个SSE命令来执行此操作,但该命令没有与之相关联的内在函数.在这一点上,我不想在我的C代码中编写内联汇编,所以我只想使用内在函数.这似乎是一个常见的计算方法,所以我对自己感到惊讶,我在Google上找不到答案.

注意:我正在针对支持SSE 4.2的特定微架构进行优化.

谢谢你的帮助.

解决方法

GCC(至少版本4.3)包括< smmintrin.h>具有SSE4.1级内在功能,包括单精度和双精度点产品:
_mm_dp_ps (__m128 __X,__m128 __Y,const int __M);
_mm_dp_pd (__m128d __X,__m128d __Y,const int __M);

作为旧处理器的回退,您可以使用此算法创建向量a和b的点积:

r1 = _mm_mul_ps(a,b);
r2 = _mm_hadd_ps(r1,r1);
r3 = _mm_hadd_ps(r2,r2);
_mm_store_ss(&result,r3);

原文地址:https://www.jb51.cc/c/111661.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐