阿里云服务器Linux系统异常CPU使用率100%排查


使用 ECS 实例的过程中,您可能碰到 CPU 使用率异常,CPU使用率高达 100% 的情况。而且无法通过 top、htop 等命令查询到消耗 CPU 资源的具体进程。本文介绍了三个重点关注的 CPU 使用率异常的排查要素,根据查询异常时间节点和连接进而确定原因。

查看 ECS 实例监控数据
1.登录 ECS管理控制台。
2.找到异常实例,并单击实例名称。在实例详情页面的 CPU 监控信息中查询实例 CPU 监控数据。

检查系统命令修改记录
1.远程连接并登录到 Linux 实例。
2.执行以下命令查看系统命令最近是否被修改过。
 stat /usr/bin/top
 stat /bin/ps
3.查看系统命令的更改时间,是否和 CPU 使用率出现 100% 的时间点吻合。


4.执行 rpm 验证是否修改过系统命令。正常情况下,您应该查看不到修改信息。

  1. rpm -Vf /bin/ps
  2. rpm -Vf /usr/bin/top

查看实例的对外连接
执行命令 iftop -i eth1 -n -P 查看当前实例是否连接到异常域名,如示例中的 crypto-pool.fr。