微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在 EMR 中为任务节点添加自定义节点标签

如何解决如何在 EMR 中为任务节点添加自定义节点标签

我只想在我的 AWS EMR 集群中的任务节点上运行我的 spark 执行程序,纱线标签是实现这一目标的方法之一。我可以在 spark-submit 期间指定标签。我想实现以下目标

  1. 在集群启动期间添加自定义标签
  2. 自动缩放期间将此标签与加入我的集群的任何节点相关联。

我想这样做是为了通过确保所有执行程序都在现场实例上运行来降低集群的成本。

解决方法

我们通过以下过程实现了它。

  1. 在 Maser 节点启动期间,我们运行我们的自定义脚本,并在其中创建新的 TASK 标签。 EMR 会自动创建核心级别。
  2. 在核心和任务节点启动期间,我们从元数据 API 确定什么是节点类型,并根据实例类型将适当的标签附加到机器上。如果是按需实例,则附加 CORE,否则将 TASK 标签添加到节点。
  3. 当我们提交我们的 Spark 作业时,我们将执行器节点标签表达式称为 TASK,这确保仅对 TASK 节点上的所有执行器。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。