微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

linux – 远程服务器挂起,卡住了.怎么调试?

我在使用Ubuntu 8.04 LTS的VmWare ESX上运行vps.
它在过去3个月里一直运行顺畅,但最近我们注意到两个奇怪的错误.

一个.服务器挂起,今天是第二次.悬挂的本质很奇怪.
我可以ping到服务器服务器,它发送回响应很好.但是sshd,apache,mysql等所有其他服务根本不响应.
工作时

telnet servername 22
Escape character is '^]'.
SSH-2.0-OpenSSH_5.X Debian-5ubuntu1

其他网络服务运行良好.当它挂起时,我可以将tcp连接到22以及80,但根本没有响应.

telnet servername 22
Escape character is '^]'.

我该如何调试这个问题?是否有可以运行的守护程序会定期记录状态?请告诉我如何处理它.

湾另一个奇怪的问题是,最近我无法传输大于100KB的文件,大约1-2 KB工作文件的较小文件.

scp anotherserver:filename .

要么

wget http://www.example.com/file

会卡住.仍有大约6GB的空间,所以我不认为这是一个问题.我应该研究哪些指针?

解决方法

我建议使用sysstat(或atsar)包中的sar.这作为一个cron作业每10分钟运行一次并记录您的服务器的重要统计信息 – 内存使用情况,cpu使用率,磁盘活动,网络活动等.

你这样使用它:

显示处理器活动(认)
sar -p(或者只是sar)

显示内存(“ram”)统计信息
sar -r

显示27日的内存统计信息
sar -r -f / var / log / sysstat / sa27

请注意,路径因安装而异.在基于redhat的系统上,文件通常位于/ var / log / sa /中,而如果安装了atsar软件包,它们将位于/ var / log / atsar / – 但模式是文件将以数字结尾,表示收集数据的当月.

某些版本(如atsar)允许您只指定日期:sar -n 27.检查安装附带的联机帮助页,以找出正确的语法以及可以检索的数据.

一旦你安装并运行了(你可能已经这样做了!),你可以使用它收集的信息来了解崩溃之前发生的事情.例如,如果报告显示您的内存已耗尽且可用交换空间倒计时为零,那么您将非常清楚要查找的内容.

有了这些信息,您可以设置其他报告,以便更好地了解错误:例如,您可以编写一个简短的bash脚本来检查某些系统统计信息(例如/ proc / meminfo或/ proc的内容) / loadavg)并且如果满足触发条件,可能会将适当的调试信息(如ps auwwxf的输出)附加到文件中,或者将信息通过电子邮件发送给您.

原文地址:https://www.jb51.cc/linux/397956.html

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐