OpenMP 运行时看不到我的 GPU 设备

如何解决OpenMP 运行时看不到我的 GPU 设备

我正在尝试将一些 OpenMP 卸载到与 GTX 1060 显卡一起使用的本地机器上的 GPU。我所有的 CUDA 和 Cublas 示例都运行良好。但是,当我尝试运行一些 OpenMP 卸载时,它根本不起作用。为了获得 OpenMP 5.0 支持,我编译了 GCC 10.2.0 工具链。经过一些调试,我发现 OpenMP 运行时没有看到任何设备。例如。此代码显示零:

#include <omp.h>
#include <stdio.h>

int main() {
    printf("%d\n",omp_get_num_devices());
    return 0;
}

但是,Nvidia 工具链已启动并正在运行:

$ nvidia-smi 
Sun Feb 21 23:06:40 2021       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06    Driver Version: 450.51.06    CUDA Version: 11.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  GeForce GTX 106...  Off  | 00000000:1D:00.0 Off |                  N/A |
|  0%   37C    P8    12W / 200W |    584MiB /  6075MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

那我错过了什么? OpenMP 运行时如何找到设备?

编辑:

我正在附加有关我的编译器的信息:

$ gcc -v
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/opt/gcc/10.2.0/libexec/gcc/x86_64-pc-linux-gnu/10.2.0/lto-wrapper
Target: x86_64-pc-linux-gnu
Configured with: ./configure --prefix=/opt/gcc/10.2.0/
Thread model: posix
Supported LTO compression algorithms: zlib
gcc version 10.2.0 (GCC)

代码是用以下命令编译的:

gcc -fopenmp simple.c

解决方法

要编译具有卸载支持的 OpenMP 代码,您需要告诉 GCC 目标平台。这是通过 -foffload=<platform> 命令行选项实现的。对于 NVIDIA 设备,平台为 nvptx-none,即您必须编译:

gcc -fopenmp -foffload=nvidia-ptx simple.c

尽管 GCC 支持卸载到多个目标平台,但由于相关的依赖关系,并非 GCC 的每个发行版都启用了它们。例如,在我的 Arch Linux 上,GCC 根本没有使用卸载支持进行编译。如果您在执行上一条命令时收到错误消息,则您的 GCC 未配置为支持 NVIDIA。 gcc -v 向您展示了编译器的配置方式等。在配置选项中查找 --enable-offload-targets=nvptx-none

GCC wiki 上的 Offloading page 提供了有关支持的卸载目标以及如何构建它们的更多详细信息。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?