如何解决NVIDIA Nsight Systems CLI 未获取内存统计信息
我正在使用 NVIDIA Nsight Systems cli (nsys
) 来分析一个简单的 cuda 程序(向量相加)。我已经检查了文档,但我想我遗漏了一些东西。
我正在运行带有 nsys profile
标志的 --stats=true
命令。
CUDA API Statistics:
Time(%) Total Time (ns) Num Calls Average Minimum Maximum Name
------- --------------- --------- ------------ ---------- ---------- ---------------------
CUDA Kernel Statistics:
Time(%) Total Time (ns) Instances Average Minimum Maximum Name
这就是我要回来的(省略了值)。我应该启用某个标志来显示内存统计信息吗?
使用 --trace=cuda
标志进行测试,但同样没有内存统计数据
- 主机:Windows 10
- Cuda 工具包版本:11.0
- Nvidia Nsight 版本:2021.1.1
这是 Windows 和 Cuda 之间的兼容性问题,我应该降级吗?我真的不知道。 当我在 Ubuntu 中运行相同的命令时工作正常。这真的让我发疯。
欢迎任何帮助 谢谢
解决方法
您所指的 memory operation statistics 跟踪统一内存 (UM) 按需分页传输活动。
Windows does not used demand-paged transfer of data 上的 UM 模型,因此您不会在 Windows 上看到这些部分。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。