当前位置：首页 > news >正文

Ubuntu系统资源监控实战：从命令行到图形化工具全解析

news 2026/6/17 5:48:53

1. 为什么需要监控Ubuntu系统资源？

刚装好的Ubuntu系统跑得飞快，用着用着突然发现电脑变卡了？浏览器开多几个标签页就开始转圈？这种情况我遇到过太多次了。后来才发现，很多时候是因为某个程序偷偷吃掉了大量CPU或内存资源。学会监控系统资源，就像给电脑装了个"健康监测仪"，随时掌握系统运行状态。

系统资源监控主要关注四大指标：CPU使用率、内存占用、磁盘I/O和网络流量。CPU使用率过高会导致系统响应变慢，内存不足会触发频繁的磁盘交换，磁盘I/O瓶颈会影响程序加载速度，网络流量异常可能意味着后台有未知的数据传输。通过实时监控这些指标，我们可以：

快速定位导致系统变慢的"罪魁祸首"
发现异常进程（比如挖矿病毒）
合理规划硬件升级（比如是否需要加内存）
优化程序性能（识别资源消耗大的代码）

在服务器环境下，资源监控更是运维人员的必备技能。我曾经管理过一台Web服务器，通过持续监控发现MySQL服务内存泄漏，及时处理避免了服务中断。接下来，我会详细介绍Ubuntu下各种监控工具的使用技巧。

2. 命令行三剑客：top/htop/atop

2.1 老当益壮的top命令

打开终端输入top，你会看到一个动态刷新的界面。别看它界面简陋，信息量可不小。顶部5行显示系统整体状态：

top - 14:30:45 up 2 days, 3:21, 2 users, load average: 0.15, 0.10, 0.05 Tasks: 215 total, 1 running, 214 sleeping, 0 stopped, 0 zombie %Cpu(s): 5.3 us, 1.2 sy, 0.0 ni, 93.5 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st MiB Mem : 7824.4 total, 1024.2 free, 4096.3 used, 2703.9 buff/cache MiB Swap: 2048.0 total, 2048.0 free, 0.0 used. 3402.1 avail Mem

这里有几个关键指标需要关注：

load average：三个数字分别代表1分钟、5分钟、15分钟的系统平均负载。这个值超过CPU核心数就说明系统过载
%Cpu(s)：us表示用户空间占用，sy表示内核空间占用，id表示空闲比例。如果id经常低于20%，就该考虑升级CPU了
Mem：重点看available内存，这个值才代表真正可用的内存量

在top界面中，按这些键可以交互操作：

M：按内存使用排序
P：按CPU使用排序
k：结束指定PID的进程
q：退出top

2.2 颜值担当htop

如果觉得top太简陋，可以试试它的升级版htop。安装命令：

sudo apt install htop htop

htop的优势非常明显：

彩色界面更直观
支持鼠标操作
树状显示进程关系
可以批量操作进程

我特别喜欢它的CPU使用率条形图，不同核心的使用情况一目了然。按F2进入设置菜单，还能自定义显示列。比如我通常会添加IO读写列，方便发现磁盘IO高的进程。

2.3 全能选手atop

atop是更专业的监控工具，记录历史数据是它的独门绝技。安装：

sudo apt install atop sudo systemctl enable --now atop

atop会定期记录系统状态（默认10分钟一次），可以用atop -r回放历史数据。这对排查间歇性性能问题特别有用。比如上周三下午系统突然变慢，用atop -r -l 14:00 16:00就能查看那个时间段的系统状态。

atop界面中，按d显示磁盘详情，n显示网络详情，m显示内存详情。它的磁盘监控特别强大，能精确到每个进程的读写量。

3. 内存监控专项工具

3.1 free命令详解

free命令是查看内存使用的最直接方式。建议加上-h参数（人类可读格式）和-w参数（分开显示buffers和cache）：

free -hw

输出示例：

total used free shared buffers cache available Mem: 7.7G 3.2G 1.1G 123M 345M 3.0G 4.0G Swap: 2.0G 0.0G 2.0G

这里最容易误解的是available列，它表示系统当前可用的内存量，包括未被使用的内存和可回收的缓存。当available接近0时，系统就会开始使用swap，性能会明显下降。

3.2 /proc/meminfo的秘密

free命令的数据其实来自/proc/meminfo，直接查看这个文件能获取更详细的信息：

cat /proc/meminfo

这里有几个关键指标：

MemTotal：物理内存总量
MemAvailable：可用内存估算值
SwapCached：被缓存使用的swap空间
Active/Inactive：活跃/非活跃内存页

我经常用这个命令检查内存泄漏：

watch -n 1 "cat /proc/meminfo | grep -E 'MemTotal|MemFree|Buffers|Cached|SwapTotal|SwapFree'"

4. CPU监控深度解析

4.1 mpstat多核监控

mpstat是sysstat工具包的一部分，能显示每个CPU核心的详细使用情况。首先安装：

sudo apt install sysstat

查看所有CPU核心的使用率（1秒刷新，共5次）：

mpstat -P ALL 1 5

输出示例：

CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle all 5.32 0.00 1.25 0.12 0.00 0.06 0.00 0.00 0.00 93.25 0 7.12 0.00 1.56 0.12 0.00 0.12 0.00 0.00 0.00 91.08 1 3.52 0.00 0.94 0.12 0.00 0.00 0.00 0.00 0.00 95.42

重点关注：

%iowait：CPU等待IO的时间占比，持续高于5%说明磁盘是瓶颈
%idle：CPU空闲率，所有核心都低于20%就该考虑升级了

4.2 性能分析神器perf

perf是Linux内核自带的性能分析工具，可以定位函数级的热点：

sudo apt install linux-tools-common linux-tools-generic perf top

这个命令会实时显示消耗CPU最多的函数，对性能调优特别有用。比如我发现一个Python程序跑得慢，用perf top发现大部分时间花在字符串处理上，优化后性能提升了3倍。

5. 图形化监控工具

5.1 Gnome系统监视器

Ubuntu自带的图形化工具，在应用菜单搜索"System Monitor"就能打开。它分为三个标签页：

进程：类似任务管理器，可以结束进程或调整优先级
资源：直观的CPU、内存、网络历史图表
文件系统：磁盘空间使用情况

我推荐在资源标签页开启"绘制平滑图形"，这样能更清晰地观察趋势变化。不过它的功能比较基础，适合临时查看用。

5.2 Conky桌面监控

Conky是高度可定制的桌面监控工具，安装配置稍复杂：

sudo apt install conky-all cp /etc/conky/conky.conf ~/.conkyrc conky

默认配置比较简陋，我推荐从GitHub找现成的主题。比如这个星空主题：

wget https://raw.githubusercontent.com/brndnmtthws/conky/master/data/configs/conky.conf -O ~/.conkyrc

配置Conky需要编辑~/.conkyrc文件，常见的监控项包括：

CPU温度：${hwmon 0 temp 1}°C
网速：${downspeed eth0} / ${upspeed eth0}
磁盘IO：${diskio_write /dev/sda} / ${diskio_read /dev/sda}

5.3 状态栏指示器

想要随时查看系统状态又不占地方？可以安装这些状态栏工具：

indicator-sysmonitor：

sudo add-apt-repository ppa:fossfreedom/indicator-sysmonitor sudo apt update sudo apt install indicator-sysmonitor

启动后右键点击状态栏图标，选择"Preferences"进行配置。我常用的显示格式：

CPU: {cpu}% | MEM: {mem}% | {net}

indicator-multiload：

sudo apt install indicator-multiload

这个工具会在状态栏显示迷你曲线图，鼠标悬停能看到具体数值。

6. 网络监控专项

6.1 实时流量监控iftop

iftop可以像top一样实时显示网络流量：

sudo apt install iftop sudo iftop -i eth0

界面分为三部分：

顶部：流量刻度尺
中部：当前连接及流量（=>表示发送，<=表示接收）
底部：统计信息（峰值速率、累计流量等）

按t可以切换显示模式，p暂停刷新，q退出。我发现它特别适合排查异常网络连接，比如发现某个IP持续大量上传数据，可能就是木马在作怪。

6.2 全能网络监控nethogs

如果想看每个进程的网络流量，可以用nethogs：

sudo apt install nethogs sudo nethogs eth0

输出示例：

PID USER PROGRAM DEV SENT RECEIVED 1234 root /usr/bin/python3 eth0 12.3KB 45.6KB 5678 alice firefox eth0 5.2MB 1.3MB

按m可以在KB/s、KB、B等不同单位间切换。我曾经用它发现一个异常进程在不断连接境外IP，及时处理避免了数据泄露。

7. 磁盘I/O监控方案

7.1 iostat磁盘负载分析

iostat是分析磁盘性能的利器，属于sysstat包：

iostat -x 1

关键指标解读：

%util：设备利用率，接近100%说明磁盘饱和
await：IO平均等待时间(ms)，超过10就要注意
svctm：IO平均服务时间(ms)

我常用的组合命令：

watch -n 1 'iostat -xmdz 1 1 | grep -v "^$" | tail -n +4'

7.2 iotop进程级IO监控

iotop可以像top一样显示进程的IO使用情况：

sudo apt install iotop sudo iotop

按o只显示有IO活动的进程，a切换累计/实时模式。它的输出非常直观：

Total DISK READ: 1.2 MB/s | Total DISK WRITE: 0.8 MB/s PID PRIO USER DISK READ DISK WRITE SWAPIN IO> COMMAND 1234 be/4 root 1.2 MB/s 0.0 KB/s 0.0 % 5.2 % [jbd2/sda1-8] 5678 be/4 mysql 0.0 KB/s 0.8 MB/s 0.0 % 3.1 % mysqld

曾经有个服务器磁盘IO异常，用iotop发现是MySQL在疯狂写临时文件，优化查询后问题解决。

查看全文

http://www.jsqmd.com/news/565635/