微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

aws Glue-JOB 问题

如何解决aws Glue-JOB 问题

我有一个粘合工作,负责将 csv 文件转换为镶木地板格式。

Input to the glue job : number of s3 csv files<N csv files>
Output from glue JOB : One parquet file per each glue-job run

我的 glue 作业是使用 pysparkglue dataframes 编写的。它一直工作到 26th march。通常需要 30 minutes 才能完成作业。

问题:最近我看到我的胶水作业连续运行 2-days 并返回 timeout error

注意事项:

Recently           I didnt changed glue code

                   I didn't changed the infrastructure setup

                   No high load of CSV files

我不知道为什么这个粘合作业需要 2 天的时间来处理并返回 TimeOut Error

谁能告诉我解决方案?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。