如何解决InfluxDB 2.0中存储桶,度量和保留策略之间的逻辑联系是什么? 以我的理解
我目前正在研究InfluxDB 2.0的文档;但是,我还不完全了解存储分区,度量和保留策略之间的逻辑。
文档说,数据库和保留策略已替换为存储桶。每个定义都包含一个存储区:
“时间序列数据存储在InfluxDB 2.0中的命名位置”
以我的理解
存储桶包含分片组 =>分片组将特定时间间隔的数据存储在特定文件夹中;例如:分片组始终可以将四个小时间隔的数据保存在一个文件夹中。
分片组包含分片 =>分片是时间序列表的单个行/点。
此外,Influx在文档中写道,一个存储桶有一项保留策略。
这意味着“存储桶”仅存储一个时间序列,而不存储多个时间序列;否则,一个存储桶可能有几个保留策略。
如果我的理解是正确的,这是否意味着只有当所有度量标准都具有相同的保留策略时,才可以将其包含在同一存储桶中?因为如果在同一存储桶中有两个具有不同保留策略的度量,则一个保留策略可能会从另一个度量中删除数据。如果我在这里感到困惑,请纠正我。
但是,如果我对的话,这会如何影响硬件要求?
Influx说系列的数目会影响硬件要求。
这实际上意味着,每一个存储桶/保留策略都会增加系列数量,并增加硬件要求?
例如,将6万个系列存储在一个存储桶中会有所不同 VS 在存储区A中存储20,000个系列,在存储区B中存储另外20,000个系列,在存储区C中存储最后的20,000个系列。
期待您的反馈!
解决方法
Alvaro-
bucket
的最重要特征是为其中的所有数据定义retention policy
。一个存储桶只有一个保留策略。如果您的数据需要两个不同的时间范围,则将需要两个存储桶。通常,这会由于下采样而降低。例如,我将高保真度1 / s数据保留一周,然后将较低分辨率的1 / min版数据保留一个月。我在这里用两个水桶。
对于InfluxDB,“时间序列”由其“序列键”定义,即测量,标签集和字段键集。因此,存储桶可以包含许多不同的时间序列。您可以将多个测量结果放入一个存储桶中。看来您熟悉InfluxDB 1.x,所以我想您已经了解测量,标签和字段。
“系列基数”是您总共拥有的时间序列数。不同存储桶中的相同系列密钥被视为单独的系列。因此,对于一个人为的示例,如果您将数据重复写入两个不同的存储桶中,但在其他方面相同,则您的基数增加了一倍。在这种情况下,对硬件的要求会更高,这很有道理-您将管理的数据增加了一倍。
此博客文章对这些概念进行了很好的概述。 Data Layout and Schema Design Best Practices for InfluxDB如果您有后续问题,请询问他们。如果您想在那里询问专门的社区,那么还会有一个InfluxDB社区闲聊。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。