微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

应如何配置 Dask yarncluster 以使用底层 EMR 集群中的所有可用资源?

如何解决应如何配置 Dask yarncluster 以使用底层 EMR 集群中的所有可用资源?

我正在考虑在专用于它的 AWS EMR 集群中运行 dask Yarncluster。我如何确保 dask_yarn.Yarnclusterscaled 以最大限度地利用底层 EMR 集群中可用的计算资源?

我是否只需从 EMR 请求与我拥有核心节点/EC2 实例相同数量的工作人员? Yarncluster 工作人员与 EMR 节点是否必须是 1:1 的关系?我应该使用 adaptive scaling feature 并将最大值设置为无穷大吗?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。