如何解决Rowkey 搜索与 RowKeyRegexFilter
我一直在尝试构建一个 API 来从我的大数据表中检索数据。
我已阅读有关如何构建行键以及行键搜索如何始终比过滤器更高效的文档,因为过滤器先查询整个表,然后再进行过滤。
我有来自现场机器的数据,并将数据存储在 Bigtable 中
我的 rowkey 结构如下:
{project}#{machine}#{aggregationType}#{ProductionSerial}#{timestamp}
AggregationType 是表示我是否想要原始值、1 分钟平均值、10 分钟平均值等。我将它们全部保存在同一个表中
生产序列 - 加班,机器输出数量单调递增的产品,如R001、R002、R003
例如:
tu7#s777#raw#R001#20210113100040
tu7#s777#raw#R001#20210113101040
tu7#s777#raw#R001#20210113102040
tu7#s777#raw#R002#20210113102040
我想查询和返回数据的方式有两种,这里是我的问题。
- 按时间戳
使用上述行键设置,我将使用 start_key 和 end_key 来指定我的查询。但是,我不知道生产序列是什么,有没有办法使用通配符?我知道这可以通过使用 RowKeyRegexFilter 应用过滤器来实现,但这效率低下。还是我错了?
- 按生产序列
这又是一个简单的例子,我将使用 start_key 和 end_key
请记住,随着机器数量的增加和流入数据的频率,数据库会随着时间的推移而变得非常大。执行查询的最佳方法是什么?
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。