如何解决Cassandra 与 RDBMS:聚类列
Cassandra 主键由分区键和集群列组成。分区键告诉哪个节点数据在,集群键决定磁盘上的顺序。如果我们不以正确的顺序提供聚集列,许多读取查询或 ORDER BY 子句将不起作用。
分区键的作用是明确的。没有它,所有节点都会被调查,从而影响性能。但是一旦我们使用分区键确定了节点,问题就简化为像传统 RDBMS 中那样查找记录,不是吗?那么,为什么 Cassandra 数据模型通过添加聚类列的概念使其变得有点不同,而且我敢说很难。可以像在 RDBMS 中一样进行排序等操作,不是吗?
解决方法
Cassandra 这样做是为了性能。您的分区可能会变大,并且为了避免在分区内进行扫描,Cassandra 按集群键排序的顺序存储数据。您可以参考 this link 以了解聚类列的存储方式。
还有一件事,除了告诉数据将出现在哪个节点之外,分区键对于确定数据不能出现的 sstable 也很有用。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。