尝试使用 GCC9.3 和 OpenMP 卸载到 GTX-1050 时出错

如何解决尝试使用 GCC9.3 和 OpenMP 卸载到 GTX-1050 时出错

构建日志:

-------------- Clean: Release in OffloadTest (compiler: GNU GCC Compiler)---------------

Cleaned "OffloadTest - Release"

-------------- Build: Release in OffloadTest (compiler: GNU GCC Compiler)---------------

g++ -Wall -m64 -fopenmp -foffload=nvptx-none -fno-stack-protector -O2 -fopenmp -foffload=nvptx-none -fcf-protection=none -fno-stack-protector  -c /home/david/CBProjects/OffloadTest/main.cpp -o obj/Release/main.o
g++  -o bin/Release/OffloadTest obj/Release/main.o  -m64 -lgomp -s -lgomp  
/usr/bin/ld: /tmp/ccfvsLgk.crtoffloadtable.o:(.rodata+0x0): undefined reference to `__offload_func_table'
/usr/bin/ld: /tmp/ccfvsLgk.crtoffloadtable.o:(.rodata+0x8): undefined reference to `__offload_funcs_end'
/usr/bin/ld: /tmp/ccfvsLgk.crtoffloadtable.o:(.rodata+0x10): undefined reference to `__offload_var_table'
/usr/bin/ld: /tmp/ccfvsLgk.crtoffloadtable.o:(.rodata+0x18): undefined reference to `__offload_vars_end'
collect2: error: ld returned 1 exit status
Process terminated with status 1 (0 minute(s),0 second(s))
5 error(s),0 warning(s) (0 minute(s),0 second(s))

我已经加载了以下内容(带有说明):

Gcc-9-offload-nvptx
    Description: The package provides offloading support for NVidia PTX. OpenMP and OpenACC programs linked with -fopenmp will by default add PTX code into the binaries,which can be offloaded to NVidia PTX capable devices if available.
Gcc-offload-nvptx
    Description: This package contains libgomp plugin for offloading to NVidia PTX. The plugin needs libcuda.so.1 shared library that has to be installed separately.
Nvptx-tools
    Description: This tool consists of nptx-non-as: "assembler" for PTX,nvptx-none-ld: "linker" for PTX. Additionally,the following symlinks are installed: nvptx-none-ar: link to the GNU/Linux host system's ar,nvptx-none-ranlib: link to the GNU/Linux host system's ranlib

我已验证 libcuda.so.1 位于 /lib/x86_64-linux-gnu

脚本很简单,只是一个帮助我开始卸载和运行的示例。如果我去掉“目标”关键字,它工作正常

#include <iostream>
#include <omp.h>

using namespace std;
#define iSize 200000
long *A,*B;

int main()
{
   A = new long[iSize];
   B = new long[iSize];
   long sum = 0;
   double dStart,dEnd;
   int iNumberOfDevices = omp_get_num_devices();
   int iInitialDevice = omp_get_initial_device(); // device number for host computer
   int iDeviceNumber = omp_get_default_device();

   dStart = omp_get_wtime();
#pragma omp parallel for
   for (long i=0; i<iSize; i++)
   {
      A[i] = i;
      B[i] = i+1;
   }
#pragma omp target parallel for reduction(+:sum)
   for (long i=0; i<iSize; i++)
   {
      for (long j=0; j<iSize; j++)
      {
         sum += 3 * A[i] - B[j];
      }
   }
   dEnd = omp_get_wtime();
   double dtime = dEnd - dStart;
   cout << "Number of devices = " << iNumberOfDevices << endl;
   cout << "Device number = " << iDeviceNumber << endl;
   cout << "Initial Device number (host processor) = " << iInitialDevice << endl;
   cout << endl;
   cout << "Sum = " << sum << endl;
   cout << "Processing time = " << dtime << " Seconds" << endl;
}

感谢任何帮助。

  • 大卫

解决方法

要解析 undefined reference,请指定 -fopenmp(如果不是默认值,则可能再次指定 -foffload=nvptx-none)而不是 -lgomp(顺便说一下,重复) .

我认为还缺少一些用于在设备上设置 omp target dataA 数组的 B(或类似)指令吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?