dask-dataframe - 编程之家

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

dask-dataframedask-dataframe专题提供dask-dataframe的最新资讯内容，帮你更好的了解dask-dataframe。

如果将dask dataframe列的数据类型转换为integer

我正在处理大型数据集。为了更快地进行处理，我正在使用快速数据帧。当我将dask数据帧的一列

作者：佚名时间：2022-08-18

ModuleNotFoundError：没有名为“ dask.dataframe”的模块； 'dask'不是软件包

对于当前的项目，我计划将Dask合并为两个非常大的CSV文件，以替代Pandas。我已经通过<code>pip install "da

作者：佚名时间：2022-08-16

为什么简单的数据框不能与Numba中的CUDA目标一起使用？

我正在尝试使用Numba jit在dask数据帧上的GPU上运行。代码如下。 <pre><code>@jit(target='cuda') def return

作者：佚名时间：2022-08-15

熊猫：在聚合函数中获取absmean

<a href="https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.agg.html" rel="nofollow noreferrer">From the docs</

作者：佚名时间：2022-08-15

为控制流“计算”还是构建完全延迟的任务图更好？

我有一个现有的Pandas代码库，并且刚刚开始尝试将其转换为Dask。我仍在尝试绕着Dask <code>dataframe</code>，<

作者：佚名时间：2022-08-12

如何将Dask Delayed应用于以下数据类型转换函数？

我正在使用庞大的数据集解决<a href="https://www.kaggle.com/c/ieee-fraud-detection" rel="nofollow noreferrer">https://www.kagg

作者：佚名时间：2022-08-12

将ast.literal_eval与dask系列一起使用

我有一个格式为<code>"[[Integer1, tag1], [Integer2, tag2]]"</code>的字符串作为dask系列中的值，并且想使用<c

作者：佚名时间：2022-08-11

如何将外部参数传递给Dask？

我正在尝试使用Dask增强代码的性能。在我当前使用pandas的代码中，我在其他参数上应用了一些其他过程

作者：佚名时间：2022-08-10

查找 Dask 数据帧的长度

我正在尝试使用 <code>len(dataframe[column])</code> 查找 dask 数据帧的长度，但每次尝试执行此操作时都会出现

作者：佚名时间：2022-08-07

您如何使用 dask 对列进行分组并使用自定义函数进行应用而不会耗尽内存？

我知道我可以在 spark 上轻松做到这一点，但一直在尝试使用 dask 并不断出现内存不足错误，也许我没有

作者：佚名时间：2022-08-06

字符串数据转换处理300MB，在Dask中具有30M记录分布式

在Node1（4CPU，8GB）上启动Dask Scheduler： Dask Scheduler：<code>dask-scheduler --host 0.0.0.0 --port 8786</code> <

作者：佚名时间：2022-07-23

将索引设置为不同的除法会导致错误

我正在用除法在ddf上设置索引。当我这样做时，出现以下错误。仅当我更改我的部门时，才会发生错误

作者：佚名时间：2022-07-26

达斯克杀害工人，同时读取并保存大的.csv文件

我大约有1.5 TB的数据分为大约5500个json文件，我需要使用map_partition处理（NN搜索）并保存结果。（GCS）

作者：佚名时间：2022-07-27

如何在Numpy Busday_count中使用Dask DataFrame？

我正在将Pandas / Numpy代码转换为Dask，以处理较大的数据集。我似乎无法重新创建以下Pandas / Numpy代码：</p

作者：佚名时间：2022-06-12

通过DASK连接非常大的数据帧

我有大型的csv文件（每个3gb 5个csv），并且需要在不崩溃的情况下将它们连接起来。根据之前发布的一

作者：佚名时间：2022-06-12

Python Dask-所有列的分组依据性能

我想计算数据中唯一行的数量。下面是一个快速的输入/输出示例。 <pre><code>#input A,B 0,0 0,1 1,0 1,0 1,1 1,

作者：佚名时间：2022-06-12

如何在dask.dataframe.where中指定元数据？

我正在尝试解决一个简单的问题，但是卡在此元数据问题中。我正在处理的问题是数据，应用了功能工

作者：佚名时间：2022-06-10

Dask中的每个工人正在处理多少行/大小的数据？

我有一个包含200个分区的dask数据框。使用.compute（）计算分析结果之后，我可以看到所用内存，任务进

作者：佚名时间：2022-06-10

有没有办法增量更新Dask元数据文件？

我正在尝试处理数据集，并随着在Dask中的写出进行增量更新。 Dask元数据文件在重新读取处理后的数据

作者：佚名时间：2022-06-09

Dask Dataframe GroupBy.size返回memoryError

我有两个大的CSV文件，每个文件约2800万行。我正在执行内部联接，在新的Dask Dataframe中添加列，然后在

作者：佚名时间：2022-06-08

小编推荐

苹果市值2025年有望达4万亿美元