微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

AWS 数据管道中 EC2 资源的 AWS IAM 设置

如何解决AWS 数据管道中 EC2 资源的 AWS IAM 设置

我在通过 Shell 命令活动让 AWS Data Pipeline 在 EC2 实例上运行时遇到问题。

我一直在按照此处的指南逐步操作:https://medium.com/@SarwatFatimaM/data-scientists-guide-setting-up-aws-datapipeline-for-running-python-etl-scripts-using-c6c8fa4de70d

我遇到的主要问题是管道将挂在 WAITING_FOR_RUNNER 状态。 我已经确认我的 python 脚本和 .bat(必须从 .sh 更改,因为我使用的是 windows ec2)在所需的 Ec2 实例内运行。但是,据我所知,这个问题是我从 Datapipline Architect 内部收到的警告的结果:

Errors/Warnings
Object:DefaultResource1
WARNING: Could not validate S3 Access for role. Please ensure role ('DataPipelineDefaultRole') has s3:Get*,s3:List*,s3:Put* and sts:AssumeRole permissions for DataPipeline.

我尝试编辑 IAM 角色,以便 DataPipelineDefaultRole 和 DataPipelineDefaultResourceRole 都可以访问 AmazonEc2FullAccess、AmazonS3FullAccess、AWSDataPipelineRole、AWSDataPipeline_FullAccess 策略,并尝试此处显示的建议内联策略: AWS Data Pipeline: Issue with permissions S3 Access for IAM role 在这里https://forums.aws.amazon.com/thread.jspa?threadID=241048

我已经让这些政策搁置了几个小时,并且我已经重建了几次管道,但我仍然不断收到该特定警告。你有什么想法吗?

解决方法

根据下面 AWS 上的 AWS Data Pipeline 文档,自定义 AMI 必须安装 Linux。因此,这目前无法在 Windows EC2 上完成,必须在 Linux EC2 上完成。

https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-custom-ami.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。