微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

由于不受“支持”的停顿原因,NSight Compute 显示什么?

如何解决由于不受“支持”的停顿原因,NSight Compute 显示什么?

CUDA Profiling Guide 列出了采样的经纱停顿的各种 reasons,例如Allocation、Barrier、LG Throttle 等。而且 - NSight Compute 分析器显示这些分布作为分析结果的一部分。

问题是,某些停顿原因被列为仅从某些计算能力开始支持,例如“LG 油门:7.0+”

我的问题:如果停顿原因是“不受支持”的原因,那么在具有较早计算能力的设备中会发生什么?或者,换句话说,列出的每个停顿原因的回退是什么?

在 Ye Olde NVIDIA Visual Profiler 中,我们有一个“其他”停顿原因,请参阅:

What are "Other" Issue Stall Reasons displayed by the Nsight profiler?

但我在(我的)NSight Compute 版本中没有看到这一点。

解决方法

Nsight 计算是 not supported and not the recommended profiler for GPUs with a compute capability prior to 7.0

对于不受支持的设置中的工具行为,没有正式的定义。将其视为 UB。

对具有 cc7.0 之前的计算能力的 GPU 使用旧式分析器(nvvp、nvprof)。

,

在 Pascal GPU (sm_61) 上使用 Nsight Compute 2019.5 分析内核,需要 7.0+ 的指标 LG ThrottleSleeping 不会显示为停顿原因。

Warp states Pascal

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。