系统假死问题排查

系统假死定义

  应用进程存在,但是无法正常提供服务(请求没有响应,或者响应超时)。

系统假死原因

  主要分为两大类:连接无法建立、请求无法处理,如下图所示:
这里写图片描述

连接数达到上限

  1. 查看单个进程能打开的最大句柄数,如果太小需要进行修改;
    查看:ulimit -a
    修改:vi /etc/security/limits.conf
  2. 统计各状态的连接数量
    netstat -n | awk '/^tcp/ {++state[$NF]} END {for(key in state) print key,"\t",state[key]}'
  3. 如果ESTABLISHED占大多数,说明系统正常,已经达到单机极限,需增加机器数量;如果TIME_WAIT或者CLOSE_WAIT过多,查看博文进行排查修复。

系统负载过高

  1. 通过top命令查看系统平均负载,如果负载过高,查看博文进行排查修复。
已标记关键词 清除标记
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页