dask-delayed - 编程之家

我使用 Dask 的代码具有以下结构： <pre><code>@dask.delayed def calculate(data): services = data.service_id prices

我在并行化读取一些文件并写入 neo4j 的代码时遇到问题。 <ul> <li>我正在使用 dask 并行化 <strong>process_

我想将一个形状为 df1.shape = (80000, 18) 的大熊猫数据框合并到一个名为“key”的列上一个形状为 df2.shape =

我有一个存储在 <code>dask_arr_ls</code> 中的延迟 dask 数组列表，我想将其转换为 dask 数据帧。这是我的管道

我有一个包含多个 <code>.feather</code> 文件的 s3 文件夹，我想使用 python 将这些文件加载到 <code>dask</co

是否有通过 dask 将 numpy 数据转换为张量的标准工作流程？ <ol> <li>通过 <code>Dask Array (NumPy)</code> 将原

我正在尝试在 PBS 集群上使用 Dask 并行化类中的方法。我最大的挑战是这种方法应该并行化一些计

我在磁盘上有一个 5230x5229x500 的 3D 图像作为 40 GB 以上的二进制文件，我想使用 Dask 在它上面运行一些图

我正在创建一个读取整个文件夹的函数，创建一个 Dask 数据帧，然后处理该数据帧的分区并对结果求和

寻找嵌套并行作业的最佳实践。我无法嵌套 dask 延迟或期货，因此我将两者混合以使其正常工作。这不

我不熟悉并行处理并询问应用程序。所以我有 1000 个文件要并行运行，所以我使用 Dask 计算来执行此操

我不明白常规 Dask 和 <code>dask.distributed</code> 之间的关系。使用 <code>dask.distributed</code>，例如使用 F

我有以下功能 <pre><code>@dask.delayed def load_ds(p): import xarray as xr multi_file_dataset = xr.open_mfdataset(p, com

我正在 jupyterlab 上运行 dask。我正在尝试将一些文件保存在存储我的 python 文件的主目录中，并且它运行

我有一个相当复杂的 Python 算法，需要分布在 HPC 集群中。该代码从具有 60 GB 内存的 Jupyterhub 实例

我在一台机器上使用 Dask（<code>LocalCluster</code> 有 4 个进程、16 个线程、68.56GB 内存）并且在尝试一次计

我在使用 dask 的 <code>LocalCluster</code> 时遇到了一些内存问题。我在一台有 32 个 CPU 的机器上工作，但我

我想使用 <code>glPopMatrix</code> 的并行计算来加速函数 <code>my_func()</code> 的执行。在 3 维循环中，<cod

我正在尝试计算两个后续图像之间粒子的位移，并将生成的位移图显示为 <a href="https://napari.org/docs/0.4.6/i

我对一些数据进行了一系列计算，我将这些数据建模为具有 dask 延迟的图形，并且运行良好，但是创建