如何解决使用 neon/simd 优化 Vector3 类
我想知道是否值得像我对 Vector2 类所做的那样使用 neon/simd 优化我的 Vector3 类的操作。
据我所知,simd 只能同时处理两个或四个浮点数,所以对于我的 Vector3,我们需要这样的东西:
Vector3 Vector3::operator * (const Vector3& v) const
{
#if defined(__ARM_NEON__)
// extra step: allocate a fourth float
const float v4A[4] = {x,y,z,0};
const float v4B[4] = {v.x,v.y,v.z,0};
float32x4_t r = vmul_f32(*(float32x4_t*)v4A,*(float32x4_t*)v4B);
return *(Vector3*)&r;
#else
return Vector3(x * v.x,y * v.y,z * v.z);
#endif
}
这样安全吗?在大多数情况下(例如 arm64),这个额外的步骤是否仍然比非 simd 代码更快?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。