如何解决为什么 Cassandra 4.x 中不支持 ZSTD 作为压缩线协议?
在挖掘 Cassandra 源代码时,我注意到不支持 ZSTD 作为 Cassandra 上的有线协议。唯一的选择是 LZ4 和 Snappy。
即使在即将发布的 Cassandra 4.x 版本中也不支持 ZSTD。然而,4.x https://github.com/apache/cassandra/blob/cassandra-4.0-rc1/src/java/org/apache/cassandra/transport/Compressor.java#L127
中提供了基于 ZSTD 的存储压缩虽然 Cassandra 是可插入的,而且制作补丁以添加 ZSTD 支持似乎相当简单 - 我不知道为什么省略了这样的东西。
与 Cassandra 相关的一切似乎都有相当多的部落知识与之相关,因此充满了好奇心。
解决方法
整体权衡可能是因为压缩、传输压缩数据然后使用 ZSTD 解压缩的总时间高于不压缩传输。然而,对于存储而言,较低的空间需求证明了开销是合理的。
使用诸如 https://quixdb.github.io/squash-benchmark/#transfer-plus-processing 之类的工具,您可以自己运行数字并探索这些数字,选择各种处理器和数据集。
例如,它向我展示了 lz4 和 snappy 都比不压缩要快,但是 zstd 压缩的更高开销并没有被它的快速解压缩和较小的传输所抵消,而不是完全不压缩。>
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。