如何解决如何在Code Workbook中访问数据集的旧事务?
在Contour中,您可以通过单击顶部的“版本”按钮来访问旧交易。
如何在代码工作簿中执行此操作?
解决方法
您可以创建一个模板,以将transaction_id
,branch
和dataset
引入,如下所示:
def time_machine():
from pyspark.sql import SQLContext
sql_context = SQLContext(spark.sparkContext)
transaction_id = '{{{transaction_id}}}'
branch = '{{{branch}}}'
path = '{{{path}}}'
return sql_context.sql("SELECT * FROM `%s:%s@%s`.`%s`" % (transaction_id,transaction_id,branch,path))
在代码工作簿中,您将创建一个新的转换并从模板开始,以导入所需的事务。
但是请务必检查您的保留政策!如果您的保留政策已删除旧交易,您将无法拉入旧交易。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。