当前位置: 首页 > news >正文

蓝易云 - CentOS下查看ssd寿命

蓝易云|CentOS 下查看 SSD 寿命(SMART/NVMe 一次打透)🧠

在 Linux 侧评估 SSD 寿命,核心看两类数据:写入量(已写 TB)磨损百分比(剩余寿命/已用寿命)。SATA/SSD 走 SMART,NVMe 走 NVMe SMART Log;两套口径不同,但都能落到“还能撑多久”的运维决策上🙂


1)先确认盘符(避免看错盘)✅

lsblk -o NAME,MODEL,SIZE,ROTA,TYPE,MOUNTPOINT

解释:

  • ROTA=0通常表示固态盘;先把目标设备(如/dev/sda/dev/nvme0n1)锁定,避免误判。

nvme list

解释:

  • 仅对 NVMe 生效;能直接看到控制器与命名空间(如/dev/nvme0n1),后续读日志更精准。


2)安装必备工具(CentOS 7/8/Stream 通用)🧰

sudo yum -y install smartmontools

解释:

  • 安装smartctl,用于读取 SATA/SAS 盘 SMART;属于最通用的健康检查工具集。

sudo yum -y install nvme-cli

解释:

  • 安装nvme命令,用于读取 NVMe SMART/寿命指标;NVMe 不建议只靠 smartctl“硬读”。


3)SATA SSD:用 smartctl 直接看“磨损/写入量”📌

sudo smartctl -a /dev/sda

解释:

  • -a输出完整 SMART/日志;重点关注包含Media_Wearout_IndicatorWear_Leveling_CountTotal_LBAs_Written等字段(不同厂商名字可能不一致)。

sudo smartctl -a /dev/sda | egrep -i 'Wear|Media|LBAs_Written|Percent|Realloc|Uncorrect|CRC'

解释:

  • 用筛选把关键项“聚焦”;运维看寿命就看这几行,效率更高。


4)NVMe SSD:看“Percentage Used”最直观 🚀

sudo nvme smart-log /dev/nvme0

解释:

  • Percentage Used已用寿命百分比(越大越接近寿命末期)。

  • Data Units Written:累计写入量(单位为 NVMe 规范定义的数据单元)。

  • Critical Warning:不为 0 需立刻进入“风险响应”。

sudo nvme smart-log /dev/nvme0 | egrep -i 'critical_warning|percentage_used|data_units_written|media_errors|num_err_log_entries'

解释:

  • 直接提取“决策字段”:是否告警、磨损到多少、写了多少、是否出现介质错误。


5)把“写入量”换算成 TB(给你可交付的数字)📈

SATA:LBA → TB(常见每 LBA=512B)

sudo smartctl -a /dev/sda | awk '/Total_LBAs_Written/ {lba=$NF} END{printf "Approx Written: %.2f TB\n", lba*512/1024/1024/1024/1024}'

解释:

  • Total_LBAs_Written乘 512 字节,再换算 TB;用于给老板/客户一个“已写入 X TB”的确定口径。

  • 注意:少数盘的扇区大小可能不是 512B,此时以smartctl显示的逻辑扇区为准。

NVMe:Data Units Written → TB(1 单元=1000×512B)

sudo nvme smart-log /dev/nvme0 | awk '/data_units_written/ {u=$3} END{printf "Approx Written: %.2f TB\n", u*1000*512/1024/1024/1024/1024}'

解释:

  • NVMe 的Data Units Written按规范换算;得到的 TB 适合做容量规划与寿命评估。


原理解释表(看到这张就会判寿命)🧾

指标(重点红字)常见来源含义运维建议
Percentage UsedNVMe smart-log已用寿命%≥80% 进入更换窗口;=100% 视为寿命耗尽风险
Media Wearout / Wear Levelingsmartctl磨损/均衡信息数值异常或快速上升:重点排查写放大与业务写入模型
Total Written TB两者皆可换算累计写入量结合厂商 TBW/DWPD 做容量与更换计划
Critical WarningNVMe关键健康告警非 0:立刻备份、迁移、准备更换
Reallocated/UncorrectSMART重映射/不可纠正错误出现即应提高告警等级,结合业务容错策略决策

决策流程(不纠结,按流程办事)🔁

flowchart TD A[识别盘符] --> B[读取 SMART/NVMe 日志] B --> C{<span style="color:#e53935;font-weight:700;">Critical Warning</span> 或 错误项异常?} C -- 是 --> D[备份/迁移 + 计划更换] C -- 否 --> E{<span style="color:#e53935;font-weight:700;">Percentage Used</span> ≥ 80%?} E -- 是 --> F[纳入更换窗口 + 监控频率加密] E -- 否 --> G[例行巡检 + 记录写入增长趋势]

实话实说的建议

如果你发现寿命指标“还行”,但业务仍频繁卡顿/IO 抖动,问题往往不在寿命本身,而在写放大、队列深度、文件系统参数、日志型业务写入模式。你把smartctl -anvme smart-log的关键输出贴出来(打码序列号即可),我可以帮你给出更精准的“是否该换盘 + 为什么 + 怎么降写入”的结论🙂

http://www.jsqmd.com/news/233871/

相关文章:

  • 大模型意图识别完全指南:从基础方法到95%准确率的进阶技巧
  • Rembg抠图GPU加速:CUDA配置指南
  • 从零部署Qwen2.5-7B-Instruct大模型|vLLM+Chainlit完整指南
  • 导师推荐10个AI论文软件,专科生毕业论文写作必备!
  • ❿⁄₈ ⟦ OSCP ⬖ 研记 ⟧ 密码攻击 ➱ 破解SSH私钥的密码短语
  • Gitee:本土化技术生态如何重塑中国开发者的创新范式?
  • 跟我学C++中级篇—C++17中的元编程逻辑操作
  • Rembg图像分割实战:发丝级边缘处理教程
  • 基于Qwen2.5-7B实现离线推理与工具调用实战
  • WebUI集成+热力图可视化|轻松实现单目深度感知
  • Rembg抠图技术详解:Alpha通道生成的科学原理
  • 电商图片自动化:Rembg结合Python批量处理
  • 国内企业数字化转型加速,Gitee CI/CD解决方案成合规高效首选
  • ResNet18安全测试:隔离环境放心跑,不影响主机
  • ResNet18+Flask构建Web应用:云端GPU加速开发
  • Rembg API调用教程:Python集成步骤详解
  • Rembg模型部署:脱离ModelSecope的稳定方案
  • Qwen2.5-7B实战:基于LoRA的高效微调与推理优化
  • 文献检索在学术研究中的应用与实践探讨
  • 无人机航拍巡检数据集
  • Qwen2.5-7B指令模型离线部署与工具扩展详解
  • 初级测开面试题分享(无答案)
  • 常见的数据库面试题含答案
  • ResNet18省钱攻略:云端按需付费,比买显卡省万元
  • 2025中国力学大会AI+分享 | 国防科技大学刘杰研究员:AI赋能PDE全流程求解
  • 快速上手Qwen2.5-7B-Instruct:基于vLLM和chainlit的完整流程
  • pytest 的 request fixture:实现个性化测试需求
  • Rembg抠图与TensorRT:加速推理教程
  • 【必读收藏】AI工程师必备:向量数据库选型决策框架与实践指南
  • Rembg模型优化:INT8量化加速推理教程