微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

连接大型 xarray 列表的最佳方法

如何解决连接大型 xarray 列表的最佳方法

我有一个很大的 xarray 列表(名为 results_list,大约有 620000 个 xarray(每个 xarray 具有以下配置:shape=(73,41,1)dtype=np.float32)。 我可以处理 72 个内核的集群(每个内核 30Go RAM)。

为了只将 xarrays 连接成一个 dask 数组,我尝试了以下步骤:

import dask.array as da
rho = [da.from_array(result[0].data.squeeze()) for result in results_list]

它没有我想象的那么快(cpu 时间 = 1 分 39 秒),但这不是瓶颈。

那么: da_rho = da.concatenate(rho,axis=0)

这个计算需要太多时间(cpu 时间 = 14 分 5 秒),因为我将不得不做几十次这样的操作,但我时间有限。

是否可以使用 dask 显着减少时间计算?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。