如何解决JDBC 源连接器错误:事务已中止由于范围内的键发生冲突,它被更高优先级的事务伤害
我将 JDBC 源连接器与 JDBC 驱动程序结合使用,以将数据从 Google Cloud Spanner 收集到 Kafka。 我在表上使用“时间戳+递增”模式。该表的主键包括 2 列(order_item_id 和 order_id)。 我使用 order_item_id 作为递增列,使用名为“updated_time”的列作为时间戳列。
当我启动连接器时,有时会出现以下错误,但最终还是可以获取数据。
ERROR Failed to run query for table TimestampIncrementingTableQuerier{table="order_item",query='null',topicPrefix='test_',incrementingColumn='order_item_id',timestampColumns=[updated_time]}: {}
(io.confluent.connect.jdbc.source.JdbcSourceTask:404)
com.google.cloud.spanner.jdbc.JdbcSqlExceptionFactory$JdbcAbortedDueToConcurrentModificationException:
The transaction was aborted and could not be retried due to a concurrent modification
...
Caused by: com.google.cloud.spanner.AbortedDueToConcurrentModificationException:
The transaction was aborted and could not be retried due to a concurrent modification
...
Suppressed: com.google.cloud.spanner.connection.AbstractBaseUnitOfWork$SpannerAsyncExecutionException:
Execution failed for statement:
SELECT * FROM `order_item` WHERE `order_item`.`updated_time` < @p1 AND ((`order_item`.`updated_time` = @p2 AND `order_item`.`order_item_id` > @p3) OR `order_item`.`updated_time` > @p4) ORDER BY `order_item`.`updated_time`,`order_item`.`order_item_id` ASC
...
Caused by: com.google.cloud.spanner.AbortedException: ABORTED: io.grpc.StatusRuntimeException:
ABORTED: Transaction was aborted. It was wounded by a higher priority transaction due to conflict on keys in range [[5587892845991837697,5587892845991837702],[5587892845991837697,5587892845991837702]),column adjust in table order_item.
retry_delay {
nanos: 12974238
}
- Statement: 'SELECT * FROM `order_item` WHERE `order_item`.`updated_time` < @p1 AND ((`order_item`.`updated_time` = @p2 AND `order_item`.`order_item_id` > @p3) OR `order_item`.`updated_time` > @p4) ORDER BY `order_item`.`updated_time`,`order_item`.`order_item_id` ASC'
...
我想知道在我的情况下这个错误是如何发生的。顺便说一句,即使出现错误,连接器仍然可以在最后收集数据。任何人都可以帮忙吗?非常感谢!
解决方法
我不确定您的整个管道是如何设置的,但错误表明您正在读/写事务中执行查询。 Cloud Spanner 上的任何读/写事务都可能被 Cloud Spanner 中止,并可能导致您看到的错误。
如果您的管道仅从 Cloud Spanner读取,最好的做法是将您的 JDBC 连接设置为只读和自动提交 模式。您可以通过将 readonly=true
和 autocommit=true
属性添加到 URL 来直接在 JDBC 连接 URL 中执行此操作。
示例:
jdbc:cloudspanner:/projects/my-project/instances/my-instance/databases/my-database;readonly=true;autocommit=true
也可能是您使用的框架在打开 JDBC 连接后更改了它。在这种情况下,您应该看看是否可以在框架中更改它。但在这种情况下,根据上述示例更改 JDBC URL 可能就足够了。
背景信息:
如果在关闭自动提交的情况下打开 JDBC 连接并且连接处于读/写模式,那么在执行查询时将自动启动读/写事务。所有后续查询也将使用相同的读/写事务,直到在连接上调用 commit()
。这是在 Cloud Spanner 上读取大量数据效率最低的方式,因此应尽可能避免。它还会导致事务中止,因为读取操作会锁定正在读取的数据。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。