如何解决Tensorflow 2.x CPU和GPU分析和执行
我正在python 3.7中使用tf 2.3训练DNN,并注意到许多tf操作是在CPU中而不是在GPU中执行的,而对于tf如何决定在哪里执行每个操作没有明确的区分。
例如,在使用探查器时,我注意到有时tf.where(SelectV2)在GPU中执行,但大多数情况下是在CPU中执行,即使我在命名空间之前指定应使用gpu({{1 }}。
在读取following answer之后,我尝试在运行操作之前将数据强制转换为float32,但它们仍在CPU上执行。
- 如何控制哪些设备上运行哪些操作?
- 是否可以获得GPU支持的操作列表?
- 是否有一种简单的方法可以分析图形中CPU操作的发生位置(traceviewer中的名称范围似乎仅与GPU有关)?
- 如何确定何时在CPU中运行调用以及何时在GPU中运行以及将图形跟踪到trace_viewer中的位置?
谢谢!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。