thrust专题提供thrust的最新资讯内容,帮你更好的了解thrust。
我对 CUDA 和推力有点陌生,目前我正在努力解决以下问题: 我有 2 个结构体携带数据。 <pre><code
我发现如何使用 cuda/thrust 沿着矩阵的行或列执行 <code>argsort</code>。 这意味着给定一个矩阵如:
我一直在尝试实现一些需要在推力::device_ptr上调用reduce的代码,结果在处理大值时与CPU实现不一致。我
<strong>有没有办法将 CUDA 推力库与 Valgrind 内存泄漏检查器一起使用?</strong> 我问的原因是因为这个
我正在尝试根据索引累积数组。我的输入是两个长度相同的向量。第一个向量是索引。第二个向量是值
我对 Thrust 比较陌生,正在尝试执行分段扫描。这是我的代码,您应该可以按原样运行: <pre><code>#incl
我编写了一些代码来使用推力计算每段的 set_difference。这个想法是使用额外的数组来指示哪个元素属于
我有一个很长的双精度向量 x[]。我还有另一个很长的布尔值 xMask[] 向量。它们具有相同的尺寸。我想使
我希望沿 z 轴对大型 3D 数组进行排序。 示例数组为 X x Y x Z (1000x1000x5) 我想沿 z 轴排序,因此
我正在使用 opengl(实现 sph 算法)开发流体模拟器。我尝试了很多方法来运行我的模拟器,首先我使用
我不确定这是否可能以异步方式实现,但我想做的是以下内容。假设我在设备上有以下数组: <code>
我想知道 <code>thrust::merge</code> 在内部使用哪种合并算法。 例如,<code>mgpu::merge</code> <a href="https://mo
<h2>问题</h2> 使用 <code>complex *</code> 将 <code>float *</code> 转换为 <code>double *</code> 或 <code>reinterpret_cast()</code
所以我有一个帮助类(创造性地命名为“BetterVector”),旨在从主机和设备来回传递,其大部分功能都
我有一个 <code>uint8_t</code> 类型的设备向量,如果可能,我想使用 <code>thrust::reduce</code> 计算它的总和。
我是 CUDA 的新手。我读到有必要使用 cudaMalloc 分配变量,然后使用 cudaMemcpy 将值复制到设备变量。像这
当我运行这段代码时,编译器说我正在从全局函数调用一个宿主函数。 我想为 A[i] 和 B[i] 分配比零更复
以下面的代码为例: <pre class="lang-cpp prettyprint-override"><code>#include &lt;iostream&gt; #include &lt;thrust/device_vec
我知道我们可以用这样的推力计算 CPU(主机)阵列的总和。 <pre><code>int data[6] = {1, 0, 2, 2, 1, 3}; int resu
我正在尝试在 WSL2 上运行一个带有 Cuda Thrust 函数的简单 C++ 程序。似乎程序在运行时无法分配设备内存