我们有四台服务器用于关键任务应用程序,它们都需要不断连接 – 总共六个永远连接.我需要一种方法来监控这些连接,并在其中任何一个发生故障时至少发送一封电子邮件.我可以找到集中式解决方案,但没有什么能真正适合这个法案.有什么建议?
像MarkM一样,我打算推荐Nagios – 但我认为你需要更仔细地计划你实际测量的内容.我期望有4个equeivalent节点,有12个连接(ab,ac,ad,ba,bc,bd,ca,cb,cd,da,dc)除非一些连接是双向的(?) .
使用Nagios很可能定义要定期执行的活动检查,或让守护进程等待接收状态通知(在这种情况下是来自启动服务器的通信失败),甚至触发一些自动响应处理(例如重新启动崩溃的Web服务器进程).但你需要考虑如何处理裂脑情景.
您可以在专用服务器上运行Nagios守护程序,也可以在群集中的一个或任意数量的节点上运行Nagios守护程序 – 但要注意同时从多个监视节点启动自动响应.
C.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。