如何解决使用参数手动触发气流DAG,然后传递给python函数
我想将参数传递给气流 DAG 并在 python 函数中使用它们。我可以将参数用作 bash 运算符,但找不到任何将它们用作 python 函数的参考。
from airflow import DAG
from airflow.operators.bash_operator import BashOperator from airflow.operators.python_operator import Pythonoperator from airflow.utils.dates import days_ago
#Define DAG
dag = DAG("test_backup",schedule_interval=None,start_date=days_ago(1))
#Parameter
owner="{{ dag_run.conf['owner'] }}"
table="{{ dag_run.conf['table'] }}"
run_this="echo "+owner+"."+table
def test_func(owner,table):
print(owner+"."+table)
task1 = BashOperator(
task_id='test_task1',bash_command=run_this,dag=dag,queue='cdp_node53',)
task2 = Pythonoperator(
task_id='test_task2',python_callable=test_func(owner,table),)
我想在触发 DAG 时将下面作为参数传递。 “task1”对我来说很好用。我需要使“task2”可行。请指导我更正上面的代码,以便我可以向其中传递参数。
{"owner":"test_owner","table":"test_table"}
解决方法
要将参数传递到 PythonOperator
中,您应该使用 op_args
(用于位置参数)或 op_kwargs
(用于关键字参数)。这两个参数也是模板字段,因此值也可以是 Jinja 表达式。
使用 op_kwargs
重构您的代码:
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
from airflow.operators.python_operator import PythonOperator
from airflow.utils.dates import days_ago
#Define DAG
dag = DAG("test_backup",schedule_interval=None,start_date=days_ago(1))
#Parameter
owner="{{ dag_run.conf['owner'] }}"
table="{{ dag_run.conf['table'] }}"
run_this="echo "+owner+"."+table
def test_func(owner,table):
print(owner+"."+table)
task1 = BashOperator(
task_id='test_task1',bash_command=run_this,dag=dag,queue='cdp_node53',)
task2 = PythonOperator(
task_id='test_task2',python_callable=test_func,op_kwargs={"owner": owner,"table": table},)
两个任务现在都将记录 INFO - test_owner.test_table
。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。