Linux云服务器系统卡顿排查
ahcoder 2025-01-09 10:10 11 浏览
本文档适用于系统运维工程师,通过本文档可以根据cpu/内存占用率异常增高导致的Linux云服务器卡顿有一个清晰的排查思路。
1 cpu使用率
1.1 Cpu使用率查看
在系统维护的过程中,随时可能有需要查看 CPU 使用率,并根据相应信息分析系统状况的需要。在 Linux中,可以通过 top 命令来查看 CPU 使用状况。运行 top 命令后,CPU 使用状态会以全屏的方式显示,并且会处在对话的模式 -- 用基于 top 的命令,可以控制显示方式等等。退出 top 的命令为 q (在 top 运行后敲 q 键一次)。
#top
top 的全屏对话模式可分为3部分:系统信息栏、命令输入栏、进程列表栏。
1.1.1 第一部分 最上部的系统信息栏 :
第一行( top)
“13:53:46”为系统当前时刻;
“59min”为系统启动后到现在的运作时间;
“2 users”为当前登录到系统的用户,更确切的说是登录到用户的终端数 -- 同一个用户同一时间对系统多个终端的连接将被视为多个用户连接到系统,这里的用户数也将表现为终端的数目;
“load average”为当前系统负载的平均值,后面的三个值分别为1分钟前、5分钟前、15分钟前进程的平均数,一般的可以认为这个数值超过 CPU 数目时,CPU 将比较吃力的负载当前系统所包含的进程;
第二行(Tasks)
“160 total”为当前系统进程总数;
“1 running”为当前运行中的进程数;
“159 sleeping”为当前处于等待状态中的进程数;
“0 stoped”为被停止的系统进程数;
“0 zombie”为被复原的进程数;
第三行(%Cpus)
分别表示了 CPU 当前的使用率;
第四行(Mem)
分别表示了内存总量、当前使用量、空闲内存量、以及缓冲使用中的内存量;
第五行(Swap)
表示类别同第四行(Mem),但此处反映着交换分区(Swap)的使用情况。通常,交换分区(Swap)被频繁使用的情况,将被视作物理内存不足而造成的。
1.1.2 第二部分 中间部分的内部命令提示栏:
top 运行中可以通过 top 的内部命令对进程的显示方式进行控制。内部命令如下表:
l - 关闭或开启第一部分第一行 top 信息的表示
t - 关闭或开启第一部分第二行 Tasks 和第三行 Cpus 信息的表示
m - 关闭或开启第一部分第四行 Mem 和 第五行 Swap 信息的表示
N - 以 PID 的大小的顺序排列表示进程列表
P - 以 CPU 占用率大小的顺序排列进程列表
M - 以内存占用率大小的顺序排列进程列表
h - 显示帮助
n - 设置在进程列表所显示进程的数量
q - 退出 top
s - 改变画面更新周期
1.1.3 第三部分 -- 最下部分的进程列表栏:
以 PID 区分的进程列表将根据所设定的画面更新时间定期的更新。通过 top 内部命令可以控制此处的显示方式
内容解释:
PID:进程的ID
USER:进程所有者
PR:进程的优先级别,越小越优先被执行
NInice:值
VIRT:进程占用的虚拟内存
RES:进程占用的物理内存
SHR:进程使用的共享内存
S:进程的状态。S表示休眠,R表示正在运行,Z表示僵死状态,N表示该进程优先值为负数
%CPU:进程占用CPU的使用率
%MEM:进程使用的物理内存和总内存的百分比
TIME+:该进程启动后占用的总的CPU时间,即占用CPU使用时间的累加值
COMMAND:进程启动命令名称
1.2 Cpu占用高的分析过程
Cpu占用高通常表现为:
(1)Terminal操作无响应
(2)服务器运行的业务响应迟钝
此时我们通过top,查看CPU 使用率,输入P,以 CPU 占用率大小的顺序排列进程列表
第一步:我们看到CPU占用率最大的command为gzip,找到占用CPU过高的进程的pid为9806
第二步:根据实际业务情况,判断该进程是否确实需要较高的cpu资源,如果异常,且无法关闭,可以进行如下操作
第三步:执行
kill -9 9806
再次执行top
可以看到gzip进程已被kill,cpu使用率也恢复了正常
2 内存使用率
2.1 内存使用率查看
free命令是一个快速查看内存使用情况的方法,它是对 /proc/meminfo 收集到的信息的一个概述。
#free
total used free shared buff/cache available
Mem: 3880368 814004 2597788 18432 468576 2784716
Swap: 4194300 0 4194300
内容解释
Total:内存总数,物理内存总数
Used:已经使用的内存数
Free:空闲的内存数
Shared:多个进程共享的内存总额
buffers Buffer:缓存内存数
cached Page:缓存内存数
-buffers/cache:应用使用内存数
+buffers/cache:应用可用内存数
Swap:交换分区,虚拟内存
语法选项
-b:以Byte为单位显示内存使用情况
-k:以KB为单位显示内存使用情况
-m:以MB为单位显示内存使用情况
-o:不显示缓冲区调节列
-s<间隔秒数>:持续观察内存使用状况
-t:显示内存总和列
-V:显示版本信息。
ps命令可以实时的显示各个进程的内存使用情况。可以使用 “–sort”选项对进程进行排序,例如按RSS进行排序:
#ps aux --sort -rss
top命令提供了实时的运行中的程序的资源使用统计。你可以根据内存的使用和大小来进行排序,进入到top之后,输入M,以内存占用率大小的顺序排列进程列表
2.2 内存使用率高分析过程
操作系统级分析
通过top查看设备整体运行状况,进入top之后按M
我们看到占用内存最多的commadn为dd命令,我们根据业务需要,看下改进程是否确实需要较高的内存,如果不需要,或者想直接停掉改进程,可以执行
#kill -9 12483
再次执行top查看已经没有该进程
进程分析
通过ps命令,可以使用 “–sort”选项对进程进行排序,例如按RSS进行排序
我们看到占用内存最多的command为dd命令,我们根据业务需要,看下改进程是否确实需要较高的内存,如果不需要,或者想直接停掉改进程,可以执行
#kill -9 12903
再次执行ps -aux --sort -rss查看已经没有该进程
相关推荐
- Linux基础运维篇:Linux日志管理(第013课)
-
日志是什么Linux系统中的日志就像是一个记录员,它会把系统中发生的各种事情都记录下来,比如系统什么时候启动了、哪些用户登录了系统、运行了哪些程序、程序有没有出错、硬件有没有问题等等。这些记录对于系...
- 目标取代deb包格式,深度Linux操作系统公布“如意玲珑”项目
-
IT之家7月16日消息,7月13日,在上海站的deepinMeetup如意玲珑专场上,深度操作系统官方正式宣布了项目全新的品牌名称——如意玲珑(Linyaps)。目前如意玲珑已...
- 基于 Linux 快速搭建私有化 Helm Chart 仓库(ChartMuseum 实战指南)
-
一、前言在Kubernetes中,Helm是最流行的包管理工具,用于简化应用部署与管理。如果你希望在内网环境中部署、管理自己的HelmCharts,就需要搭建一个私有化HelmChart...
- Linux环境开发效率--那些强大的命令
-
之前写了一篇关于linux下常用的几个命令,参考Linux入门--提高工作效率的命令。接下来接着介绍一些在linux下做开发经常使用到得命令,其中有打包压缩命令tar,文件查找命令find,文件内容查...
- 怎么使用再生龙打包(备份)liunx系统
-
liunx系统区别于Windows,由于分区格式的特殊性并不能像GHOST那样进行备份封包,有款开源的针对liunx系统备份还原的软件-再生龙(clonezilla),可能有部分人已经用过,本篇文章让...
- python打包那些事儿(python的打包)
-
python是个万金油,什么活都能干,开发一些小应用的时候,要想其他人也方便使用,就需要对程序进行打包生成可执行文件,不再依赖python环境或者其他文件。前几天写了一个视频去水印的小程序,主要依赖f...
- 「项目部署」使用Jenkins一键打包部署SpringBoot应用
-
前言嗨,大家好,我是希留,一个被迫致力于全栈开发的老菜鸟。一般而言,一个项目部署的由:拉取代码->构建->测试->打包->部署等过程组成,如果我们经常需要部署项目,特别是在微服...
- Linux面试最高频的5个基本问题(linux面试题必会题目)
-
CPU利用率和CPU负载的区别是什么提到CPU利用率,就必须理解时间片。什么是CPU时间片?我们现在所使用的Windows、Linux、MacOS都是“多任务操作系统”,就是说他们可以“同时”运行多...
- jtti:如何将Linux服务器的文件系统创建成镜像
-
如何将Linux服务器的文件系统创建成镜像?如何把Linux文件系统创建成一个镜像文件,也就是"系统打包"?这类操作不仅适用于迁移、备份,还能用于批量部署、自定义系统安装,甚至可以作为...
- 用Nuitka打包 Python,效果竟如此惊人!
-
使用Python开发一个程序后,将Python脚本打包成独立可执行文件是一项常见需求。Nuitka是一个Python到C的编译器,它会将Python代码转换为等效的C代码,然后使用标...
- Linux基础运维篇:Linux软件包管理(第014课)
-
什么是软件包管理在Linux系统中,软件包管理就像是一个“软件管家”,负责软件的安装、卸载、更新以及软件之间依赖关系的处理。它把软件及其相关的文件、配置信息等打包在一起,方便用户进行管理和操作。...
- 给你的Nodejs后端项目打个包(node为基础的后端框架)
-
前阵子,碰到个问题用Nodejs做了个小项目需要交付客户使用之前Nodejs做的都是自用,所以也没碰到需要打包保护源码之类的问题上网搜了半天,找到的大多是针对Vue的前端项目打包/混淆,例如用...
- 爆强!直接把 Python 编写的图形程序打包为安卓 APP
-
请大家多多关注点赞哦如果想使用Python语言编写图形界面程序,那么有不少的框架可以提供支持,比如Tkinter、QtforPython、WxPython等等。不过这些框架都是只能创建桌面图...
- 几行代码教你zip打包(打包zip命令)
-
01准备有时我们不想去手动一个个去操作,然后傻等他打包完,python依赖库zipfile很方便地帮助我们封装了解压压缩,shutil用于文件目录处理,方法类似于linux命令。1、安装pipin...
- Linux基础运维篇:Linux文件操作超详细版(第007课)
-
一、Linux文件系统基础1.文件类型Linux一切皆文件,常见文件类型:普通文件(-):文本文件(.txt)、二进制文件(可执行程序)、压缩文件等。目录文件(d):用于组织文件和子目录(类似...
- 一周热门
- 最近发表
- 标签列表
-
- linux 远程 (37)
- u盘 linux (32)
- linux 登录 (34)
- linux 路径 (33)
- linux 文件命令 (35)
- linux 是什么 (35)
- linux 界面 (34)
- 查看文件 linux (35)
- linux 语言 (33)
- linux代码 (32)
- linux 查看命令 (33)
- 关闭linux (34)
- root linux (33)
- 删除文件 linux (35)
- linux 主机 (34)
- linux与 (33)
- linux 函数 (35)
- linux .ssh (35)
- cpu linux (35)
- 查看linux 系统 (32)
- linux 防火墙 (33)
- linux 手机 (32)
- linux 镜像 (34)
- linux mac (32)
- linux ip地址 (34)