微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Databricks表是否支持事务隔离级别

如何解决Databricks表是否支持事务隔离级别

我正在使用Azure databricks服务中的databricks表,但是,在我看来databricks表不支持事务隔离级别?在另一个进程访问(读取/修改)同一张表的同时更新/删除/插入表时会发生什么情况?

解决方法

Azure Databricks表架构是不可变的。

Azure Databricks上的Delta Lake支持两种隔离级别:可序列化和WriteSerializable。

Delta Lake在读取和写入之间提供ACID事务保证。这意味着:

  • 跨多个群集的多个编写器可以同时修改表分区并查看表的一致快照视图,并且这些写入将有一个串行顺序。
  • 即使在作业过程中修改了表,读者仍会继续看到Azure Databricks作业开始的表的一致快照视图。

表的隔离级别定义了必须将事务与并发事务所做的修改隔离的程度。 Azure Databricks上的Delta Lake支持两种隔离级别:可序列化和WriteSerializable。

可序列化:最强的隔离级别。它确保提交的写入操作和所有读取都可序列化。只要存在一次执行一次序列操作的序列,并且该序列产生与表中所示结果相同的结果,就可以允许该操作。对于写操作,序列顺序与表的历史记录完全相同。

WriteSerializable(默认)::隔离级别比Serializable弱。它仅确保写入操作(即读取操作)是可序列化的。但是,这仍然比快照隔离更强大。 WriteSerializable是默认的隔离级别,因为它为大多数常见操作提供了数据一致性和可用性之间的最佳平衡。

在这种模式下,增量表的内容可能与表历史记录中的操作顺序所期望的不同。这是因为此模式允许某些并发写入对(例如,操作X和Y)继续进行,从而即使历史记录显示Y,结果也好像Y在X之前执行(即,它们之间可序列化)。是在X之后提交的。要禁止这种重新排序,请将表隔离级别设置为Serializable可导致这些事务失败。

有关每种隔离级别上哪些操作类型可能相互冲突以及可能的错误的更多信息,请参见Concurrency control

有关更多详细信息,请参阅“ Azure Databricks - Isolation levels”。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其他元素将获得点击?
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。)
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbcDriver发生异常。为什么?
这是用Java进行XML解析的最佳库。
Java的PriorityQueue的内置迭代器不会以任何特定顺序遍历数据结构。为什么?
如何在Java中聆听按键时移动图像。
Java“Program to an interface”。这是什么意思?