Airflow 长时间运行的作业在 1 小时后终止,但任务仍处于运行状态

如何解决Airflow 长时间运行的作业在 1 小时后终止,但任务仍处于运行状态

我需要一个长时间运行的 dag 的帮助,该 dag 在一个小时后仍然失败,但任务仍处于运行模式。 过去 6-8 个月我一直在使用 Airflow。我在我们的基础设施团队的帮助下在我们公司设置了 Airflow。它在 AWS ECS 集群上运行。 dag 位于 EFS 实例中,吞吐量设置为预配置。日志写入 s3 存储桶中。 对于 worker aws ecs 服务,我们有一个自动缩放策略,它在晚上 1 点扩大集群并在凌晨 4 点缩小。 对于短期工作,它运行良好。它也成功地完成了一个持续时间长的工作,该工作间歇性地将结果写入红移表。 但是现在我有一项工作是循环遍历一个熊猫数据框并更新两个字典。 问题: 作业完成大约需要 4 小时,但在大约 1 小时后它会自动失败而不会出现任何错误。任务仍处于运行模式,直到我手动停止它。当我尝试查看日志时,实际日志没有出现它显示

[2021-05-04 19:59:18,785] {taskinstance.py:664} INFO - Dependencies not met for <TaskInstance: app-doctor-utilisation.execute 2021-05-04T18:57:10.480384+00:00 [running]>,dependency 'Task Instance State' Failed: Task is in the 'running' state which is not a valid state for execution. The task must be cleared in order to be run.
[2021-05-04 19:59:18,786] {local_task_job.py:90} INFO - Task is not able to be run

现在,当我停止任务时,我可以看到一些日志以及最后的以下日志。

[2021-05-04 20:11:11,785] {helpers.py:325} INFO - Sending Signals.SIGTERM to GPID 38
[2021-05-04 20:11:11,787] {taskinstance.py:955} ERROR - Received SIGTERM. Terminating subprocesses.
[2021-05-04 20:11:11,959] {helpers.py:291} INFO - Process psutil.Process(pid=38,status='terminated',exitcode=0,started='18:59:13') (38) terminated with exit code 0
[2021-05-04 20:11:11,960] {local_task_job.py:102} INFO - Task exited with return code 0

有人可以帮我解决这个问题吗?是否有任何解决方案?

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?