自定义气流操作员在 Salesforce 表中运行查询

如何解决自定义气流操作员在 Salesforce 表中运行查询

我是气流的新手,我想安排一个作业,其中来自不同数据库记录计数的两个表必须检查它是否匹配。一个来源是 GCP,另一个来源是 Salesforce。

所以我找到了 BigQueryOperator 在 GCP 端点击查询并返回计数结果,但我找不到任何看起来像 SalesforceQueryOperator 的运算符,我可以在 Airflow 任务中分配它。

所以基本上,我说的是我们可以用来带来计数结果的这个:

t1 = BigQueryOperator(
        task_id='bigquery_test',bql='SELECT COUNT(userId) FROM [events:EVENTS_20160501]',destination_dataset_table=False,bigquery_conn_id='bigquery_default',google_cloud_storage_conn_id='bigquery_default',delegate_to=False,udf_config=False,dag=dag,)

我知道我们可以创建一个函数、导入库、创建与 Salesforce 的连接并运行查询获取 Count 结果,但我不想遵循我已经在下面给出的这种方法代码的一部分)试过了。

def salesforcequery_count():
from simple_salesforce import Salesforce
import requests

session = requests.Session()
# manipulate the session instance (optional)
sf = Salesforce(
   username='user@example.com',password='password',organizationId='OrgId',session=session)
   count_record = sf.query("SELECT count(id) FROM Contact")
//   for row in data:
//   process(row)
    return 'count_record'

我想创建一个看起来像 SalesforceQueryOperator 并且应该像 BigQueryOperator 一样的自定义运算符来点击 Salesforce 表中的查询并带来结果。

这里是参考:https://airflow.apache.org/docs/apache-airflow/stable/howto/custom-operator.html

任何帮助将不胜感激。

解决方法

您可以使用现有的 SalesforceHook 创建您自己的自定义运算符。

这是一个例子:

from airflow.contrib.hooks.salesforce_hook import SalesforceHook
from airflow.models import BaseOperator
from airflow.utils.decorators import apply_defaults


class SalesforceQueryOperator(BaseOperator):
    """
    Make a query against Salesforce
    Return result as dict.
    """
    template_fields = ("query",)

    @apply_defaults
    def __init__(self,conn_id,query=None,*args,**kwargs
                 ):
        super(SalesforceQueryOperator,self).__init__(*args,**kwargs)

        self.conn_id = conn_id
        self.query = query

    def execute(self,context):
        sf_hook = SalesforceHook(conn_id=self.conn_id)

        results = sf_hook.make_query(self.query)

        return results

然后在您的 DAG 中使用它:

t2 = SalesforceQueryOperator(
        task_id='salesforce_test',query='SELECT count(id) FROM Contact',conn_id='salesforce_default',dag=dag,)

其中 salesforce_default 是您在 AirFlow 中添加的连接。您可以在此处查看如何添加它:Salesforce Connection

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?
Java在半透明框架/面板/组件上重新绘画。
Java“ Class.forName()”和“ Class.forName()。newInstance()”之间有什么区别?
在此环境中不提供编译器。也许是在JRE而不是JDK上运行?
Java用相同的方法在一个类中实现两个接口。哪种接口方法被覆盖?
Java 什么是Runtime.getRuntime()。totalMemory()和freeMemory()?
java.library.path中的java.lang.UnsatisfiedLinkError否*****。dll
JavaFX“位置是必需的。” 即使在同一包装中
Java 导入两个具有相同名称的类。怎么处理?
Java 是否应该在HttpServletResponse.getOutputStream()/。getWriter()上调用.close()?
Java RegEx元字符(。)和普通点?