如何解决Cuda 后端的 ArrayFire 卷积问题
我在调用某个函数时遇到了问题
dphaseWeighted = af::convolve(dphaseWeighted,m_slowTimeFilter);
似乎只生产nan的。
背景是我们最近从使用 AF OpenCL 切换到 AF Cuda,我们看到的问题发生在函数中。
dphaseWeighted = af::convolve(dphaseWeighted,m_slowTimeFilter);
这在使用 OpenCL 时似乎运行良好。
不幸的是,由于 IP 问题,我无法为您提供全部功能。只有几个片段。
这个卷积深藏在一个阶段提取的代码段中。并且实际上是使用 af::convolve 函数的代码的第二部分。 第一个函数似乎按预期运行,输出了合理的浮点数据。 但是当涉及到第二个函数时,我看到的是 nan 出现了(我认为 af_print amd 将数据转储到文件中。
在我包含的 CMakeList 中
include_directories(${ArrayFire_INCLUDE_DIRS})
和
target_link_libraries(DASPhaseInternalLib ${ArrayFire_CUDA_LIBRARIES})
它按预期构建。
有没有人有过这样的想法?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。