当前位置: 首页 > news >正文

Linux磁盘空间管理实战:从目录大小排查到PostgreSQL数据清理

1. 磁盘空间告警后的第一反应

收到服务器磁盘空间不足的告警时,我的第一反应不是立即删除文件,而是先搞清楚三个关键问题:哪个分区快满了?是什么类型的文件占用了空间?这些文件是否可以被安全清理?这种系统化的排查思路,能避免误删重要数据。

最常用的df -h命令就像汽车的油表,能快速显示各分区的使用情况。我习惯加上-T参数显示文件系统类型,因为不同的文件系统有不同的特性。比如看到xfs文件系统快满了要特别小心,因为XFS文件系统在空间耗尽后更容易出现故障。

# 查看各分区使用情况和文件系统类型 df -hT

当发现/var分区使用率达到95%时,我会先用cd /var进入该目录,然后用du -sh * | sort -rh | head -10找出占用空间最大的前10个目录。这个组合命令中,-s表示汇总大小,-h以人类可读格式显示,sort -rh按人类可读的数字逆序排序。

2. 深入分析大目录内容

找到大目录后,需要像侦探一样层层深入。比如发现/var/lib/postgresql占用异常,我会用--max-depth参数逐级下钻:

# 一级目录分析 du -h --max-depth=1 /var/lib/postgresql # 二级目录分析 du -h --max-depth=1 /var/lib/postgresql/12/main

对于PostgreSQL的数据目录,有几个关键子目录需要特别关注:

  • base/:存储实际数据文件,不能随意删除
  • pg_wal/:WAL日志文件,可以配置自动清理
  • pg_log/:数据库日志文件,需要定期归档

我曾遇到过pg_wal目录暴涨的情况,原因是主从复制中断导致WAL日志堆积。通过pg_controldata可以查看当前的WAL日志状态:

pg_controldata /var/lib/postgresql/12/main

3. PostgreSQL数据库的专项清理

当确定是数据库占用过大时,需要区分是正常数据增长还是异常堆积。首先查看各数据库大小:

SELECT pg_database.datname, pg_size_pretty(pg_database_size(pg_database.datname)) as size FROM pg_database ORDER BY pg_database_size(pg_database.datname) DESC;

如果发现某个表异常大,可以用以下SQL查看表的大小(含索引):

SELECT table_schema || '.' || table_name AS table_full_name, pg_size_pretty(pg_total_relation_size('"' || table_schema || '"."' || table_name || '"')) as size FROM information_schema.tables WHERE table_schema NOT IN ('pg_catalog', 'information_schema') ORDER BY pg_total_relation_size('"' || table_schema || '"."' || table_name || '"') DESC LIMIT 20;

对于需要清理的大表,TRUNCATEDELETE更高效,因为它不记录单行删除操作:

-- 清空表但保留表结构 TRUNCATE TABLE large_table; -- 清空表并重置自增序列 TRUNCATE TABLE large_table RESTART IDENTITY;

4. 自动化监控与预防措施

为了避免半夜被磁盘告警吵醒,我设置了多层防护:

  1. 每天检查磁盘空间的cron任务:
#!/bin/bash THRESHOLD=90 CURRENT=$(df / --output=pcent | tail -1 | tr -d '% ') [ $CURRENT -ge $THRESHOLD ] && echo "Warning: Disk usage is ${CURRENT}%" | mail -s "Disk Alert" admin@example.com
  1. PostgreSQL的自动维护任务:
-- 设置自动清理参数 ALTER SYSTEM SET autovacuum = on; ALTER SYSTEM SET autovacuum_vacuum_scale_factor = 0.1; ALTER SYSTEM SET autovacuum_analyze_scale_factor = 0.05; -- 限制WAL日志大小 ALTER SYSTEM SET max_wal_size = '2GB'; ALTER SYSTEM SET wal_keep_segments = 32;
  1. 日志轮转配置(/etc/logrotate.d/postgresql):
/var/log/postgresql/*.log { daily missingok rotate 7 compress delaycompress notifempty sharedscripts postrotate /usr/bin/pg_ctl logrotate -D /var/lib/postgresql/12/main endscript }

曾经有一次,一个开发环境的数据库日志配置不当,导致500GB的磁盘一周内被日志塞满。现在我会特别检查logging_collectorlog_rotation_size参数的设置是否合理。

http://www.jsqmd.com/news/1124943/

相关文章:

  • PyTorch实现MNIST手写数字识别:从入门到实践
  • 微信小程序逆向工程全流程:从抓包到源码反编译实战指南
  • YOLO目标检测实战:从环境搭建到模型部署的保姆级教程
  • DXVK:让Windows游戏在Linux上流畅运行的魔法翻译器
  • 免费开源桌面分区神器:3分钟打造整洁高效的数字工作空间
  • ChatGPT与Grok实战对比:原理差异、场景选型与双模工作流
  • 2026年AI论文助手推荐:从开题到答辩的一站式智能解决方案
  • Dify平台入门指南:从零开始构建AI应用
  • Google Cloud Vision API:如何用AI技术实现智能图像分析与识别?
  • 华为MetaERP Oracle EBS R12 AR(应收模块)完整解析|财务解决方案架构师版一、AR 模块整体定位与设计哲学1. 模块定位AR(Accounts Receivable)是销售
  • ZenlessZoneZero-OneDragon 自动化框架深度解析:架构设计与技术实现
  • 工业4-20mA电流环接收器设计与实现指南
  • 从论文到实践:一维卷积神经网络在RUL预测中的复现与调优
  • WPF可视化设计工具终极指南:如何用WpfDesigner让界面开发效率提升3倍?
  • 免费开源AMD Ryzen调试工具SMUDebugTool:从入门到精通的全方位指南
  • 跨平台玩家的终极救星:WorkshopDL如何解锁742+款Steam创意工坊模组
  • IIM-42652与PIC18F56K42实现6DoF运动追踪方案
  • 从“游蛇”木马事件看企业安全:SEO投毒、远控与应急响应实战
  • Visual Studio 2010对Scrum流程中重要事件的支持
  • STM32与SPI EEPROM高效数据存储与检索方案
  • 渗透测试入门指南:从零基础到实战环境搭建
  • GPT-5.5与DeepSeek V4选型指南:Agentic Coding与1M上下文的工程落地
  • NAS部署大模型的物理极限与务实路径
  • 基于YOLOv8的猫狗品种识别系统开发实战
  • Python通达信数据读取终极指南:告别复杂解析,开启量化分析新篇章
  • LV30条码扫描器与PIC32微控制器的工业级集成方案
  • mba学位论文怎么选题
  • 工业4-20mA电流环信号传输与XTR116应用设计
  • 威胁模型全解析:从新手入门到实战应用,助你构建安全产品!
  • 告别在线教材卡顿!用这款神器一键下载中小学智慧教育平台电子课本