微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何使用CUDA计算大矩阵的二维FFT?

如何解决如何使用CUDA计算大矩阵的二维FFT?

现在我有一个16K*16K的大矩阵,全局内存不够用。如何计算矩阵的二维FFT?

解决方法

也许使用 cuFFT 可以使用统一内存进行超额订阅?

https://developer.nvidia.com/blog/unified-memory-cuda-beginners/

您还可以分别对行和列进行 FFT,并在主机内存之间来回移动数据。

您需要完整的结果矩阵吗?你在 CPU 和 GPU 上有多少内存?输入/输出是复数值吗?您需要什么精度(16 位就足够了)?计算时间要求高吗?您还想处理更大的矩阵吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。