GCP 正常运行时间指标发出不可靠的警报

如何解决GCP 正常运行时间指标发出不可靠的警报

尝试通过创建警报策略在 GCE 虚拟机处于关闭状态时获得警报。

指标:compute.googleapis.com/instance/uptime

资源:虚拟机实例

并进行了配置,以便在此条件不存在 3 分钟时触发警报。

为了模拟上述行为,我已经停止了虚拟机,但它没有触发警报,同时数据在警报策略图中不可见

已附加触发器配置

enter image description here

解决方法

当 VM 处于停止状态时,没有任何指标提供可靠的警报,这些指标是 compute.googleapis.com/instance/uptime 或监控代理的正常运行时间或 CPU 利用率指标,直到您使用 MQL 创建警报策略 - 监控查询语言。

“与 TERMINATED 或 DELETED Google Cloud 资源关联的指标不考虑用于指标缺失政策。这意味着您不能使用指标缺失政策来测试 TERMINATED 或 DELETED Google Cloud 虚拟机。” https://cloud.google.com/monitoring/alerts/types-of-conditions#metric-absence

因此,根据上述声明,我们不能对已停止的虚拟机使用 metic 缺席策略 - 因为它在停止一段时间后会进入终止状态。原因是,它仅在再次变为运行状态时才计算实例停止时间。

但是,当您使用具有相同指标集的 MQL 配置相同条件时,指标缺失策略可以正常工作。

示例:

不要通过选择资源和指标来配置条件,而是转到查询编辑器并键入以下查询以在开发环境 VM 未处于运行状态 3 分钟时获取警报。

fetch gce_instance
| metric 'compute.googleapis.com/instance/uptime'
| filter (metadata.user_labels.env == 'dev')
| group_by 1m,[value_uptime_aggregate: aggregate(value.uptime)]
| every 1m
| absent_for 180s

不确定这是否是错误,但这是我们以传统方式配置警报条件时的限制,我们可以利用 MQL 解决此问题。

,

您所描述的行为不寻常。

我复制了您的案例并使用相同的指标 compute.googleapis.com/instance/uptime 和相同的设置创建了准确的警报政策。我已将所有警报转发到我的电子邮件。

不幸的是,我无法重现这种行为。在尝试了各种设置(集合、缺席时间)后,我收到了提醒电子邮件。

尝试重新设置提醒政策。如果您的目标只是监控虚拟机的状态(有响应或无响应),那么您可以使用任何其他指标,例如 cpu usage,当虚拟机关闭(或无响应)时,这些指标将不存在。

最后,您可以在 VM 上尝试 installing monitoring agent,这将为您提供更多可用指标,从而获得有关机器的更多信息。

查看可能对您有用的 how to manage alerting policies 文档。此外,本文档还介绍了 alerting policies types 以及如何为您的用例选择合适的一个。

最终尝试创建另一个虚拟机并为其设置警报策略。如果这不起作用,您最好的办法是转到 Google IssueTracker 并提交新的错误报告,并将由产品团队处理 - 但是这可能需要一些(或很多)时间,具体取决于问题.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


使用本地python环境可以成功执行 import pandas as pd import matplotlib.pyplot as plt # 设置字体 plt.rcParams['font.sans-serif'] = ['SimHei'] # 能正确显示负号 p
错误1:Request method ‘DELETE‘ not supported 错误还原:controller层有一个接口,访问该接口时报错:Request method ‘DELETE‘ not supported 错误原因:没有接收到前端传入的参数,修改为如下 参考 错误2:cannot r
错误1:启动docker镜像时报错:Error response from daemon: driver failed programming external connectivity on endpoint quirky_allen 解决方法:重启docker -> systemctl r
错误1:private field ‘xxx‘ is never assigned 按Altʾnter快捷键,选择第2项 参考:https://blog.csdn.net/shi_hong_fei_hei/article/details/88814070 错误2:启动时报错,不能找到主启动类 #
报错如下,通过源不能下载,最后警告pip需升级版本 Requirement already satisfied: pip in c:\users\ychen\appdata\local\programs\python\python310\lib\site-packages (22.0.4) Coll
错误1:maven打包报错 错误还原:使用maven打包项目时报错如下 [ERROR] Failed to execute goal org.apache.maven.plugins:maven-resources-plugin:3.2.0:resources (default-resources)
错误1:服务调用时报错 服务消费者模块assess通过openFeign调用服务提供者模块hires 如下为服务提供者模块hires的控制层接口 @RestController @RequestMapping("/hires") public class FeignControl
错误1:运行项目后报如下错误 解决方案 报错2:Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.8.1:compile (default-compile) on project sb 解决方案:在pom.
参考 错误原因 过滤器或拦截器在生效时,redisTemplate还没有注入 解决方案:在注入容器时就生效 @Component //项目运行时就注入Spring容器 public class RedisBean { @Resource private RedisTemplate<String
使用vite构建项目报错 C:\Users\ychen\work>npm init @vitejs/app @vitejs/create-app is deprecated, use npm init vite instead C:\Users\ychen\AppData\Local\npm-
参考1 参考2 解决方案 # 点击安装源 协议选择 http:// 路径填写 mirrors.aliyun.com/centos/8.3.2011/BaseOS/x86_64/os URL类型 软件库URL 其他路径 # 版本 7 mirrors.aliyun.com/centos/7/os/x86
报错1 [root@slave1 data_mocker]# kafka-console-consumer.sh --bootstrap-server slave1:9092 --topic topic_db [2023-12-19 18:31:12,770] WARN [Consumer clie
错误1 # 重写数据 hive (edu)> insert overwrite table dwd_trade_cart_add_inc > select data.id, > data.user_id, > data.course_id, > date_format(
错误1 hive (edu)> insert into huanhuan values(1,'haoge'); Query ID = root_20240110071417_fe1517ad-3607-41f4-bdcf-d00b98ac443e Total jobs = 1
报错1:执行到如下就不执行了,没有显示Successfully registered new MBean. [root@slave1 bin]# /usr/local/software/flume-1.9.0/bin/flume-ng agent -n a1 -c /usr/local/softwa
虚拟及没有启动任何服务器查看jps会显示jps,如果没有显示任何东西 [root@slave2 ~]# jps 9647 Jps 解决方案 # 进入/tmp查看 [root@slave1 dfs]# cd /tmp [root@slave1 tmp]# ll 总用量 48 drwxr-xr-x. 2
报错1 hive> show databases; OK Failed with exception java.io.IOException:java.lang.RuntimeException: Error in configuring object Time taken: 0.474 se
报错1 [root@localhost ~]# vim -bash: vim: 未找到命令 安装vim yum -y install vim* # 查看是否安装成功 [root@hadoop01 hadoop]# rpm -qa |grep vim vim-X11-7.4.629-8.el7_9.x
修改hadoop配置 vi /usr/local/software/hadoop-2.9.2/etc/hadoop/yarn-site.xml # 添加如下 <configuration> <property> <name>yarn.nodemanager.res