cuda-driver专题提供cuda-driver的最新资讯内容,帮你更好的了解cuda-driver。
我正在尝试使用CUDA驱动程序API启动内核。具体来说,我正在打电话 <pre><code>CUresult CUDAAPI cuLaunchKernel(
使用CUDA驱动程序API调用<code>cuStreamWaitValue32()</code>执行值等待操作时,可以指定标志<code>CU_STREAM_WAIT_VALUE_
CUDA虚拟内存API(随CUDA 10.2引入)均不采用CUDA上下文作为参数;但是-其中一些确实间接获得了设备ID。</
<code>cuMemSetAccess()</code>时,您将访问标志应用于物理内存块到虚拟内存范围的多个映射中的每个映射。
我正在对使用nvrtc库编译的内核(带有debug和lineinfo)进行性能分析。在分析结果中,许多样本都列在<code
我在GitHub库中使用<code>.travis.yml</code>在提交时自动构建。我的库最近开始链接到CUDA驱动程序库<code>libcuda
使用CUDA驱动程序将PTX代码编译为SASS时,您<a href="https://docs.nvidia.com/cuda/cuda-driver-api/group__CUDA__TYPES.html" re
我正在尝试构建以下程序: <pre><code>#include &lt;iostream&gt; #include &lt;cuda.h&gt; int main() { const char* str;
在 CUDA 11.2 中引入设备链接时间优化 (DLTO) 之前,确保向前兼容性相对容易,而无需过多担心性能差异。