如何解决Prometheus:PromQL 减法,相同的标签,不同的值
我正在使用 Hystrix、千分尺、普罗米修斯。
sum by(group,key) (increase(hystrix_execution_total{event="exception_thrown"}[1m])) / sum by(group,key) (increase(hystrix_execution_terminal_total[1m])) * 100 >= 5
基本上 exception_thrown
是 Hystrix 发出的一个事件,但 Hystrix 还发出另一个指标 bad_request
,表示客户端错误 (400)。为了准确衡量上游服务器错误,我需要减去两个具有相同标签但值不同的指标,然后获得每分钟的速率以进行警报
hystrix_execution_total{job="auth",key="authenticate",event="exception_thrown"} - hystrix_execution_total{job="auth",event="bad_request"}
解决方法
一旦有人指出标签值之间存在 1 个以上的差异,忽略就起作用了。
不仅event标签值不同,终端标签值也有相应的不同。对于exception_thrown,terminal=true,对于bad_request,terminal=false[!
sum by(group,key) (increase(hystrix_execution_total{job="auth",key="authenticate",event="exception_thrown"}[10m]) - ignoring(event,terminal) increase(hystrix_execution_total{job="auth",event="bad_request"}[10m])) / sum by(group,key) (increase(hystrix_execution_terminal_total[10m])) * 100 >= 5
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。