微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

linux – 我的进程如何检测计算机是否正在关闭?

我正在EC2现场实例上运行一些应用程序.这些情况可能会被亚马逊杀死,恕不另行通知.

关闭过程中,进程按某种顺序被终止.我们有监控/恢复程序,根据服务器是关闭还是进程崩溃,应该采取不同的行为. (具体来说,如果服务器实际关闭,我们不想做任何事情)

如何在恢复过程中检测到(如果它仍然存在)由于关闭而导致进程被终止?

(更多系统细节:我在一个修改外部状态的沙箱中运行未知/不可信/等代码.通常,如果沙盒代码崩溃,则是不受信任代码的作者的错误,我们不会重新运行它.但是如果由于VM故障或失败,沙盒代码终止,我们需要在另一个实例上重新运行.我现在遇到的问题是用户代码首先被终止,因此监控程序错误地认为崩溃是用户错误.)

解决方法

代理人

生成沙箱子进程的每台计算机上运行代理.代理运行“防崩溃”代码,沙箱代码运行可能崩溃的用户代码.

负责使用新沙箱进程启动新计算机的监视系统会检查哪些进程已被终止(代理程序和沙箱进程或仅沙箱子进程).

它通过打开TCP连接(RMI / RPC / HTTP)到代理查询其子进程来实现.
如果代理响应 – 计算机仍在运行,则可以询问其子沙箱进程.
如果代理没有响应 – 机器被怀疑被终止.

代理人(变异)

代理还负责在同一VM上重新启动子沙箱进程,以防它崩溃.

查找服务

使用查找服务(例如Zoo Keeper)来跟踪发送心跳保持活动的进程.如果代理处于活动状态,则计算机仍在运行,如果代理程序未处于活动状态,则表示该计算机未运行.

ec2 api

轮询EC2 API以确定机器是处于运行状态还是已终止状态.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


在Linux上编写运行C语言程序,经常会遇到程序崩溃、卡死等异常的情况。程序崩溃时最常见的就是程序运行终止,报告 Segmentation fault (core dumped) 错误。而程序卡死一般来源于代码逻辑的缺陷,导致了死循环、死锁等问题。总的来看,常见的程序异常问题一般可以分为 非法内存访
git使用小结很多人可能和我一样,起初对git是一无所知的。我也是因为一次偶然的机会接触到git,并被它强大的功能所蛰伏。git其实就是一种版本控制工具,就像svn一样,但是git是分布式的。我不想给git打广告,我们直入正题——git能帮我们做什么?1)源码版本控制。平常写一写demo程序可能和g
1. 操作系统环境、安装包准备 宿主机:Max OSX 10.10.5 虚拟机:Parallel Desktop 10.1.1 虚拟机操作系统:CentOS 7 x86_64 DVD 1511.iso Oracle:linux.x64_11gR2_database_1of2.zip linux.x6
因为业务系统需求,需要对web服务作nginx代理,在不断的尝试过程中,简单总结了一下常见的nginx代理配置。 1. 最简反向代理配置 在http节点下,使用upstream配置服务地址,使用server的location配置代理映射。 upstream my_server { server 10
Linux模块机制浅析 Linux允许用户通过插入模块,实现干预内核的目的。一直以来,对linux的模块机制都不够清晰,因此本文对内核模块的加载机制进行简单地分析。 模块的Hello World! 我们通过创建一个简单的模块进行测试。首先是源文件main.c和Makefile。 f...
一、Hadoop HA的Web页面访问 Hadoop开启HA后,会同时存在两个Master组件提供服务,其中正在使用的组件称为Active,另一个作为备份称为Standby,例如HDFS的NameNode、YARN 的ResourceManager。HDFS的web页面只有通过Active的Name
一个简单的通用Makefile实现Makefile是Linux下程序开发的自动化编译工具,一个好的Makefile应该准确的识别编译目标与源文件的依赖关系,并且有着高效的编译效率,即每次重新make时只需要处理那些修改过的文件即可。Makefile拥有很多复杂的功能,这里不可能也没必要一一介绍,为了
Linux内核源码分析方法一、内核源码之我见Linux内核代码的庞大令不少人“望而生畏”,也正因为如此,使得人们对Linux的了解仅处于泛泛的层次。如果想透析Linux,深入操作系统的本质,阅读内核源码是最有效的途径。我们都知道,想成为优秀的程序员,需要大量的实践和代码的编写。编程固然重要,但是往往
题记:自从接触到“跳板机”的概念后,一直就被烦不胜烦的机器名,ip地址,用户名,密码折腾的死去活来,心说能有个小精灵随时帮我输入那些重复的登录信息就好了。我见过最挫的方式就是用记事本把一堆机器的ip、登录用户、密码记录下来,每次登录机器就像是一场战斗:打开笔记本 勾选复制 写ssh命令 登录 再打开
统计一下你写过多少代码最近整理了一下自己从开始学习编程以来写过的程序和代码,林林总总,花了不少的时间,最后把一些自认为还算不错的代码提交到github上做一个简单的分类和备份。当然我并不奢求它们能成为多好的开源代码,只是希望通过这种方式分享自己的劳动成果罢了。如果大家有兴趣可以访问我的github,