VMware vCenter 7.0日志盘告警别慌!手把手教你SSH登录清理Tomcat和PostgreSQL日志(附详细路径)
VMware vCenter 7.0日志盘告警实战处理指南
收到"Log Disk Exhaustion"红色告警时,很多新手管理员会感到手足无措。这个看似严重的警告其实有标准化的处理流程。本文将带你一步步安全清理日志文件,同时避免常见操作误区。
1. 告警原理与预处理
当vCenter的/storage/log分区使用率达到80%时,系统会触发磁盘耗尽告警。这属于预防性提醒,并非系统已崩溃。在开始清理前,请确保:
- 已获取vCenter SSH访问权限(需启用SSH访问)
- 确认近期有完整备份
- 记录当前磁盘状态(后续对比用)
重要提示:删除日志文件前,建议先压缩归档而非直接删除,特别是生产环境
2. SSH连接与初始检查
使用SSH客户端连接vCenter Appliance的5480管理地址,执行以下命令序列:
# 切换到BASH环境 shell # 查看磁盘使用情况 df -h /storage/log # 进入日志目录 cd /storage/log du -sh * | sort -hr | head -10典型输出示例:
Filesystem Size Used Avail Use% Mounted on /dev/sdb1 50G 45G 2.0G 96% /storage/log 4.8G vmware 1.2G var 800M tmp3. 结构化清理流程
3.1 Tomcat服务日志清理
Tomcat是vCenter多个组件的运行容器,其日志通常占比较大:
# 清理SSO服务日志 cd /storage/log/vmware/sso/tomcat/ gzip catalina*.log && rm -f catalina*.log.* # 清理EAM服务日志 cd /storage/log/vmware/eam/web/ find . -name "catalina*" -mtime +30 -exec gzip {} \; # vCenter 7.0特有服务 cd /storage/log/vmware/lookupsvc/tomcat/ ls -lh catalina*.log | awk '{if($5>100M) print "gzip "$9}'操作后验证:
df -h /storage/log | grep -v Filesystem3.2 PostgreSQL数据库日志处理
数据库访问日志需要更谨慎处理:
# 压缩而非删除访问日志 cd /storage/log/vmware/vpostgres/ for f in $(find . -name "postgresql-*.log" -mtime +7); do gzip $f done # 清理旧日志备份 find /storage/log/vmware/vpostgres/ -name "*.gz" -mtime +90 -delete3.3 其他可能的大文件位置
如果上述操作后空间仍未释放,检查这些目录:
| 目录路径 | 典型大文件 | 处理建议 |
|---|---|---|
/var/log/vmware/vmware-sps | sps-access*.log | 按日期归档 |
/storage/log/vmware/vpxd | vpxd-*.log | 保留最近7天 |
/storage/log/vmware/vsan-health | vsan*.log | 需服务重启 |
4. 自动化预防方案
为避免频繁手动清理,建议配置日志轮转:
# 示例:配置Tomcat日志轮转 cat > /etc/logrotate.d/vmware-tomcat <<EOF /storage/log/vmware/*/tomcat/catalina.out { daily rotate 7 missingok compress delaycompress notifempty copytruncate } EOF关键配置参数说明:
daily:每天轮转rotate 7:保留7份历史compress:启用gzip压缩copytruncate:避免服务重启
5. 深度空间分析技巧
当标准清理无效时,使用进阶分析:
# 查找大于100MB的文件 find /storage/log -type f -size +100M -exec ls -lh {} \; # 按目录统计空间 cd /storage/log du -h --max-depth=1 | sort -hr # 分析日志文件增长趋势 for i in {1..7}; do date -d "$i days ago" +"%Y-%m-%d" find /storage/log -type f -name "*.log" -mtime $i -exec du -ch {} + | grep total done6. 安全操作黄金法则
删除前先备份:关键日志打包存档
tar -czvf /tmp/log_backup_$(date +%Y%m%d).tar.gz /storage/log/vmware变更窗口选择:避免业务高峰操作
操作验证三部曲:
- 执行前记录
df -h - 操作后立即验证
- 一小时后复查增长情况
- 执行前记录
文档记录要点:
- 清理时间点
- 释放空间量
- 影响的日志类型
7. 高级运维建议
对于长期运维,建议建立日志管理矩阵:
| 日志类型 | 保留策略 | 清理频率 | 关联服务 |
|---|---|---|---|
| catalina.out | 7天 | 每日 | Tomcat |
| localhost_access | 30天 | 每周 | PostgreSQL |
| vpxd.log | 14天 | 每日 | vCenter核心 |
| vsan-health | 3天 | 每日 | vSAN |
配置监控预警(示例命令):
# 添加cron任务监控 (crontab -l 2>/dev/null; echo "0 * * * * df -h /storage/log | awk '\$5 > 70 {print \"ALERT: \"\$0}'") | crontab -实际运维中发现,80%的日志磁盘告警可通过定期清理Tomcat日志避免。建议将本文操作封装为定期维护脚本,结合vCenter任务计划自动执行。
