InfluxDB2.0：如何总结不规则时间间隔的多个时间序列？

如何解决InfluxDB2.0：如何总结不规则时间间隔的多个时间序列？

TL; DR 我正在使用Influxdb v2.0，并使用Influx查询语法（如在GUI中）。我有多个数字0/1状态的系列（相同的_field，不同的标记），我想对其进行总结。问题在于状态以不规则的时间间隔存储在数据库中，这意味着在任何时候都应使用可能的最后一点来查询每个标签的真实实际值。我已经尝试过以“ last”作为函数的aggregateWindow，但是last只是为没有存储点的窗口删除表。无论如何，我可以总结一下吗？我接受任何方法（包括导出数据并使用其他语言脚本代替lmao）。预先谢谢你。

场景

我的团队已实现了一个签入/签出系统，该系统使用电话号码代表每个人在较早的现实世界中的活动，因此决定将InfluxDB v2.0用作数据库（我们选择了InfluxDB v2.0，以便我们可以通过Grafana很容易）。我有一个存储签入/签出值点的存储桶，它们都是相同的架构。该架构如下：

measurement: 'user'
tags: [phone,type]     // type is either ['normal','staff']
value: 0 or 1           // 0 for checking out event,1 for checking in event

每当有人签入事件时，都会插入值1的点，反之亦然，每当有人签出事件时，都会插入值0的点。请记住，如果用户决定像先前已经签入并再次签入一样再次触发api，则该点可能重复（不过，我们将其视为状态为1）。因此，数据就像是数字0/1状态，但是点的时间间隔不规则，每个电话号码只有一条图形线。相同的电话号码，但类型不同，对我们来说却是不同的人。

该项目已经部署完毕，我们的任务是对数据进行后处理。问题是要可视化整个时间的事件内人口图。从数学的角度来看，应该通过将每个人的所有状态（0/1行）随时间的总和轻松地解决。我首先在Influx查询中尝试过类似的方法：

from(bucket: "event_name")
  |> range(start: v.timeRangeStart,stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "user")
  |> group(columns: ["type"])
  |> aggregateWindow(every: v.windowPeriod,fn: sum,createEmpty: true)
  |> yield()

结果看起来非常有希望，一个人口图，有2种类型的Normal和Staff颜色。但是，当我仔细查看时，Influx的sum函数实际上将每个窗口中每个点的_value相加。这意味着对于某个没有点的窗口，sum函数实际上并不能汇总数据库中的每个人。目标是将没有任何点的那些窗口的实际_value求和（这些窗口的_value应该与最后一个点的_value相同，例如，就像我在7.00pm签入，并且_value应当全部为1晚上7点以后的时间，甚至某些窗口都没有任何提示）。然后我尝试了这样的事情：

from(bucket: "event_name")
  |> range(start: v.timeRangeStart,stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "user")
  |> aggregateWindow(every: 1m,fn: last,createEmpty: true)
  |> fill(usePrevious: true)
  |> group(columns: ["type"])
  |> aggregateWindow(every: 1m,fn: sum)
  |> yield()

我为每个窗口使用最后一个点，然后用上一个可能的点用空_value填充窗口，然后再次对每个窗口的_value求和。但是后来我发现last函数实际上删除了空表，这意味着没有点的窗口被删除了（然后，createEmpty就没用了）。然后问题就变成了必须找到类似last的函数，但又不删除空表。我曾尝试reduce来创建自己的逻辑，例如last，但遗憾的是，它并没有按照我的意愿进行（可能是因为我编码错误）。

如果您有任何想法，请帮助。非常感谢。

解决方法

Nvm，我找到了解决方案，这里是针对那些处在相同情况下的人的，尽管性能不是很好，但这是我发现它可行的唯一查询。

from(bucket: "event_name")
  |> range(start: v.timeRangeStart,stop: v.timeRangeStop)
  |> filter(fn: (r) => r["_measurement"] == "user")
  |> aggregateWindow(every: 1m,fn: last,createEmpty: false)
  |> aggregateWindow(every: 1m,fn: mean,createEmpty: true)
  |> fill(usePrevious: true)
  |> fill(value: 0.0)
  |> group(columns: ["type"])
  |> aggregateWindow(every: 1m,fn: sum,createEmpty: false)
  |> yield(name: "population")

我首先使用last来获取每个窗口的最新状态（尽管last实际上会删除空表，因此使createEmpty: true毫无用处）
然后对于没有任何点的窗口，我将mean与createEmpty: true一起使用，以便为空窗口创建具有空_value的点。对于实际上具有实点的窗口，mean不应更改该值，因为每个窗口仅应有1个点，因为我们之前使用过last。在这里使用mean的目的只是为空窗口创建空点。这里的步骤只是找到一个不做任何事情的函数，该函数不会删除createEmpty创建的空表。费伊，我尝试了许多函数，包括制作自己的自定义函数，例如reduce和map，但是它们确实删除了空表（甚至不允许分配null），我什至创建了一个空函数，例如{ {1}}代表fn: (tables=<-,x) => tables，但无论如何它都会删除空表。所以aggregateWindow是我最好的选择，尽管副作用是我的值从int变为float。
我在这里使用mean将空点替换为最后一个窗口中的值。这就是为什么我从最后一步开始尝试将null分配给空窗口中的点，而fill只能这样做。第二个mean用于那些应该代表0状态的早期空白窗口。
然后按类型fill并group将它们命名为我要查找的结果

希望我能在以后像我一样处境的任何人

InfluxDB2.0：如何总结不规则时间间隔的多个时间序列？

如何解决InfluxDB2.0：如何总结不规则时间间隔的多个时间序列？

解决方法

相关推荐