opencl - 编程之家

在特定设备上运行实现 tensorflow-lite 的 android 应用程序时发生错误。例如)LG X4、LG Q52 调用函

我在调用某个函数时遇到了问题 <pre><code>dphaseWeighted = af::convolve(dphaseWeighted, m_slowTimeFilter); </code></pre>

我为一个简单的图像处理任务编写了一个 OpenCL 内核：进行开运算（腐蚀 + 膨胀），然后根据开运算的结

我想写一个内核来计算向量的乘积之和，比如 <pre><code>size_t i = get_global_id(0); for(int k=0; i<n; k++) { re

如何在GPU上运行python代码，没有CUDA我找不到解决方案我尝试了这些库，但它们不适合： <ol> <li>

我有一个使用 OpenCl gpu 库的 Windows c++ 项目。我想在 github actions 中构建项目，但我不知道如何在 githubactio

<pre class="lang-c prettyprint-override"><code>@interface Resource { String name(); int priority() default 0; } /* Loc1 */ class Pr

在 Windows 10 上的 openCL 1.2 程序中，在我将内核排队几秒钟后，提示显示 ucrtbase.dll 的内存位置存在未处理

我生成了一个日志文件（在 OSX 上使用 OpenCL） <pre><code>void printErrors(const Program& program, const Device&amp

在构建 OpenCL 内核时，我有时会在链接阶段收到以下错误： <code>A/libc: Fatal signal 6 (SIGABRT), code -1 (SI_QUEUE)

我是 OpenCl 和 Cloo 的新手。我编写了如下所示的内核程序： <pre><code>string bytesToShort = @"typedef struct

我想在 8GB 内存的安卓手机中为我的 openCL 程序分配 4.5GB。但我发现 <code>CL_DEVICE_GLOBAL_MEM_SIZE</code> 的内

我有一个总体上的理解问题。对于这个问题，我建立了一个尽可能简单的场景。 <strong>让我们说：<

让我们考虑一下，当 OpenCL 中有多个工作组和多个工作人员时。如果我们在工作组中拥有与 GPU 上的“核

我有一台 AMD RX 570 4G， Opencl 告诉我，我最多可以使用 256 个工作组和每组 256 个工作项... 假设我使

我正在编写一段使用 OpenCL 使用 GPU 的代码。我成功地制作了一个运行向量加法的内核（在一个名为 <code>

我尝试在 openCL 中创建并行 bfs，但我对 C++ 没有足够的经验。所以这可能是内存错误，但我真的不知道

我有一些与 python 接口的 OpenCL 内核抛出了 pyopencl 库。内核用于加速交换操作（如加法或乘法），其中操

我决定自己学习 OpenCL 并为 TEA 算法编写一个暴力密码，我是否正确理解 OpenCL？你能在速度方面改进一些

我很难使用 2D 工作组计算正确的阵列偏移量。我用这些参数调用我的内核 <pre><code>ret = clSetKernelArg(ker