如何解决在 kusto 表上使用物化视图
我有一个场景,其中每 3 分钟从不同来源获取 20k+ 条消息的表。我想获取每个唯一来源发送的最新数据,来源可以是一个 id。我无法编写这样的查询。
FactResources | summarize arg_max(Timestamp,*) by SubscriptionId,ResourceId
- 我想了解这样做会影响集群的 cpu 性能,考虑到我的集群现在以 70% 的 cpu 利用率运行?
- 实体化视图在每次摄取后刷新的延迟是多少?
- 在 java SDK 中,我可以像调用 kusto 函数一样调用这个物化视图吗?
解决方法
- 是的,集群的 CPU 会受到影响,因为实现会消耗 CPU(就像在集群上运行的所有其他操作一样)。您可以使用
.show commands-and-queries
命令估算具体化过程消耗的资源量,如文档 here 所述。 - 无法保证实现的延迟。只要
delta
(what isdelta
?) 中有记录,并且只要集群有运行实现的可用容量,实现就会运行。延迟,称为物化视图年龄,取决于摄取模式、数据量和集群中的可用资源。您可以通过运行.show materialized-view
并检查MaterializedTo
值来检查物化视图年龄。在 performance considerations 和 monitoring 中查看更多信息。 - 您可以像查询表 (
ViewName
) 或使用materialized-view()
函数一样查询视图。见materialized views queries。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。