当前位置: 首页 > news >正文

Kubernetes StatefulSet 实战:从创建到运维的完整指南

Kubernetes StatefulSet 实战:从创建到运维的完整指南

一、前言:StatefulSet 实战核心目标

本文围绕StatefulSet 的创建、验证、扩容缩容、更新、删除五大核心操作,结合完整命令与输出示例,帮你掌握:

  • 如何快速搭建 StatefulSet + Headless Service 环境;

  • 验证 StatefulSet 的三大核心特性(稳定网络、持久存储、有序操作);

  • 生产环境常用运维操作(扩容、缩容、版本更新、删除);

  • 关键配置(更新策略、分区发布)的实操落地。

二、核心前提:StatefulSet 依赖组件

StatefulSet 运行必须满足两个核心依赖:

  1. Headless Service:提供稳定网络标识(DNS 解析),clusterIP: None

  2. PersistentVolume(PV):通过volumeClaimTemplates自动创建,保障数据持久化。

三、实战步骤 1:创建 StatefulSet 与 Headless Service

3.1 配置文件(web.yaml)
--- # Headless Service:提供稳定网络标识 apiVersion: v1 kind: Service metadata: name: nginx labels: app: nginx spec: ports: - port: 80 name: web clusterIP: None # 关键:无集群 IP,仅提供 DNS 解析 selector: app: nginx --- # StatefulSet 配置:2 个副本 + 1Gi 持久存储 apiVersion: apps/v1beta1 kind: StatefulSet metadata: name: web spec: serviceName: "nginx" # 关联 Headless Service replicas: 2 template: metadata: labels: app: nginx spec: containers: - name: nginx image: gcr.io/google_containers/nginx-slim:0.8 ports: - containerPort: 80 name: web volumeMounts: - name: www # 与 volumeClaimTemplates 名称一致 mountPath: /usr/share/nginx/html # 持久存储模板:自动为每个 Pod 创建 PVC volumeClaimTemplates: - metadata: name: www spec: accessModes: [ "ReadWriteOnce" ] # 单节点读写 resources: requests: storage: 1Gi
3.2 执行创建命令
  1. 打开两个终端窗口:
  • 终端 1(监控 Pod 状态):
kubectl get pods -w -l app=nginx
  • 终端 2(执行创建操作):
kubectl create -f web.yaml # 输出: # service "nginx" created # statefulset "web" created
  1. 验证创建结果:
# 查看 Headless Service kubectl get service nginx # 输出:NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGE # nginx None > 80/TCP 12s # 查看 StatefulSet kubectl get statefulset web # 输出:NAME DESIRED CURRENT AGE # web 2 2 30s
3.3 关键现象:有序创建 Pod

终端 1 监控到的 Pod 创建顺序:

web-0 0/1 Pending 0 0s web-0 1/1 Running 0 19s # 先启动 web-0 web-1 0/1 Pending 0 0s web-1 1/1 Running 0 18s # web-0 就绪后启动 web-1

核心特性:StatefulSet 按

0→1→N-1

顺序创建 Pod,前一个就绪后才启动下一个。

四、实战步骤 2:验证 StatefulSet 核心特性

4.1 验证稳定网络标识

每个 Pod 拥有固定主机名和 DNS 地址:

# 1. 查看 Pod 主机名(固定为 <statefulset 名称>-<序号>) for i in 0 1; do kubectl exec web-$i -- sh -c 'hostname'; done # 输出: # web-0 # web-1 # 2. 验证集群内 DNS 解析(使用 dnsutils 容器) kubectl run -i --tty --image busybox dns-test --restart=Never --rm /bin/sh # 执行 nslookup: nslookup web-0.nginx # 输出:Address 1: 10.244.1.6 web-0.nginx.default.svc.cluster.local nslookup web-1.nginx # 输出:Address 1: 10.244.2.6 web-1.nginx.default.svc.cluster.local

关键结论:即使 Pod 重建,主机名和 DNS 地址不变,仅 IP 可能更新。

4.2 验证稳定持久存储

数据不随 Pod 重建丢失:

# 1. 向每个 Pod 的存储写入主机名(模拟业务数据) for i in 0 1; do kubectl exec web-$i -- sh -c 'echo $(hostname) > /usr/share/nginx/html/index.html'; done # 2. 验证数据写入成功 for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done # 输出: # web-0 # web-1 # 3. 删除所有 Pod,观察重建后数据是否保留 kubectl delete pod -l app=nginx # 等待 Pod 重建完成后,再次验证: for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done # 输出仍为 web-0、web-1,数据未丢失!

核心特性:每个 Pod 绑定独立 PV,删除 Pod 后 PV 不删除,重建后自动挂载。

五、实战步骤 3:常用运维操作(扩容 / 缩容 / 更新 / 删除)

5.1 扩容 StatefulSet(从 2 到 5 个副本)
# 终端 1 监控 Pod 状态:kubectl get pods -w -l app=nginx # 终端 2 执行扩容: kubectl scale sts web --replicas=5 # 输出:statefulset "web" scaled

关键现象:按2→3→4顺序创建 Pod,每个 Pod 就绪后才启动下一个。

5.2 缩容 StatefulSet(从 5 到 3 个副本)
# 终端 1 监控 Pod 状态 # 终端 2 执行缩容: kubectl patch sts web -p '{"spec":{"replicas":3}}' # 输出:"web" patched

关键现象:按4→3反向顺序删除 Pod,前一个 Pod 完全终止后才删除下一个。

5.3 更新 StatefulSet(镜像版本升级)

StatefulSet 支持两种更新策略,实操如下:

策略 1:OnDelete(默认,手动触发更新)
# 1. 修改镜像版本(从 0.8 到 0.7) kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]' # 2. 手动删除 Pod,触发更新(仅删除的 Pod 会更新) kubectl delete pod web-0 web-1 web-2 # 3. 验证更新结果 kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}' # 输出:所有 Pod 镜像已更新为 0.7
策略 2:RollingUpdate(自动滚动更新)
# 1. 配置滚动更新策略 kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate"}}}' # 2. 修改镜像版本(从 0.7 回滚到 0.8) kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.8"}]' # 3. 监控更新过程(反向顺序:web-2→web-1→web-0) kubectl get po -l app=nginx -w
高级操作:分区更新(金丝雀发布)

仅更新序号 ≥ partition 的 Pod:

# 1. 配置分区(仅更新序号 ≥2 的 Pod,即 web-2) kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate","rollingUpdate":{"partition":2}}}}' # 2. 修改镜像版本,仅 web-2 会更新 kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]' # 3. 验证结果(仅 web-2 为 0.7,其余为 0.8) kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}'
5.4 删除 StatefulSet
方式 1:非级联删除(仅删 StatefulSet,保留 Pod 和 PV)
kubectl delete statefulset web --cascade=false # 验证:Pod 仍运行,PV 保留 kubectl get pods -l app=nginx kubectl get pvc -l app=nginx
方式 2:级联删除(删 StatefulSet + Pod,保留 PV)
kubectl delete statefulset web # 验证:Pod 按反向顺序删除,PV 仍存在 kubectl get pods -l app=nginx # 无输出 kubectl get pvc -l app=nginx # 仍显示绑定状态 # 手动删除 Headless Service(级联删除不会删 Service) kubectl delete service nginx

六、关键配置与生产实践总结

操作类型核心命令 / 配置关键注意事项
创建kubectl create -f web.yaml必须先创建 Headless Service
扩容 / 缩容kubectl scale sts plicas=N有序扩容、反向缩容,依赖前驱 Pod 就绪
版本更新RollingUpdate/OnDelete生产环境优先用RollingUpdate,支持回滚
金丝雀发布partition: N仅更新序号 ≥N 的 Pod,适合灰度验证
删除--cascade=false/ 默认PV 永远不会自动删除,需手动清理无用 PV
数据持久化volumeClaimTemplates确保 StorageClass 已配置,避免 PVC Pending

七、核心结论

  1. StatefulSet 的核心价值是稳定标识 + 持久存储 + 有序操作,专为数据库、缓存等有状态服务设计;

  2. 运维关键:牢记「有序创建 / 缩容 / 更新」特性,避免强制终止 Pod 导致数据不一致;

  3. 存储管理:删除 StatefulSet 后,需手动清理无用 PV,避免存储资源浪费;

  4. 更新策略:生产环境优先使用RollingUpdate + partition,实现安全的灰度发布和版本回滚。

通过本文实操,可快速掌握 StatefulSet 从部署到运维的全流程,直接复用命令和配置到生产环境。

http://www.jsqmd.com/news/695343/

相关文章:

  • ElementPlus Calendar 组件深度定制:从预约系统到数据可视化
  • ARM7500 LCD接口设计与优化实践
  • 2026年AI自进化系统融合路径
  • 2026 年 4 月有实力的电线电缆厂家/电力电缆/低压电缆/国标电缆厂家推荐 - 海棠依旧大
  • 从科研绘图到商业报表:手把手教你用Python Matplotlib定制高级图表样式
  • CUDA 13新特性深度实测:7类主流AI算子(GEMM/Softmax/FlashAttention)性能提升3.8–17.2倍的5个关键配置
  • 2026年怎么搭建Hermes/OpenClaw?阿里云环境及token Plan配置详解
  • Beelink ME Pro混合设备:NAS与迷你PC二合一深度评测
  • 抖音批量下载终极指南:免费开源工具快速上手
  • 如何用WaveTools让《鸣潮》突破120帧限制?终极免费优化指南
  • MINIX Z100-AERO迷你主机评测:多屏办公与网络性能解析
  • 感应电机矢量控制调速仿真PI参数自整定 Matlab/Simulink仿真模型 1
  • Windows上安装Android应用的终极指南:告别模拟器的原生体验
  • Kubernetes Ingress 完全解析:从原理到实战的外部流量接入方案
  • 《C# 12和.NET 8入门与跨平台开发》 Visual Studio 2026社区版界面语言设置
  • C++ MCP网关上线即崩?(生产环境全链路故障复盘:从epoll惊群到Rust替代方案评估)
  • 告别臃肿OS:构建轻量级MCU任务轮询框架的实践指南
  • 云原生可观测性策略
  • 高压直流输电系统在线监测控制系统功能说明
  • 为什么92%的量子新手在VSCode里卡在调试阶段?揭秘量子断点失效的底层机制与3行修复代码
  • DeepSeek-V4-平民指南
  • 告别Navicat报错:SpringBoot + MyBatis-Plus 连接 PostgreSQL 的三种姿势与避坑指南
  • 10人SolidWorks团队如何通过云主机实现“设计-仿真-制造”一体化
  • LFM2.5-1.2B-Instruct对比传统方法:在PID控制器参数整定建议上的效果
  • RDKit实战:用MolToSmiles标准化SMILES时,别忘了这个参数,否则手性全丢了
  • 别再混淆了!一文搞懂AD9361的CMOS、LVDS和SPI接口到底该怎么选?
  • 2026年近期河北PVC排水管采购指南:实力厂家雄县宇通深度解析 - 2026年企业推荐榜
  • C#怎么操作数据库存储过程 C#如何调用SQL Server存储过程传参并获取返回结果【数据库】
  • CUDA Graph + Dynamic Parallelism双模优化实战(LLaMA-3 8B自定义算子端到端加速手册,限内部团队泄露版)
  • PlayCover深度解析:如何在Apple Silicon Mac上完美运行iOS应用的3个关键技术