Kubernetes StatefulSet 实战:从创建到运维的完整指南
Kubernetes StatefulSet 实战:从创建到运维的完整指南
一、前言:StatefulSet 实战核心目标
本文围绕StatefulSet 的创建、验证、扩容缩容、更新、删除五大核心操作,结合完整命令与输出示例,帮你掌握:
如何快速搭建 StatefulSet + Headless Service 环境;
验证 StatefulSet 的三大核心特性(稳定网络、持久存储、有序操作);
生产环境常用运维操作(扩容、缩容、版本更新、删除);
关键配置(更新策略、分区发布)的实操落地。
二、核心前提:StatefulSet 依赖组件
StatefulSet 运行必须满足两个核心依赖:
Headless Service:提供稳定网络标识(DNS 解析),
clusterIP: None;PersistentVolume(PV):通过
volumeClaimTemplates自动创建,保障数据持久化。
三、实战步骤 1:创建 StatefulSet 与 Headless Service
3.1 配置文件(web.yaml)
--- # Headless Service:提供稳定网络标识 apiVersion: v1 kind: Service metadata: name: nginx labels: app: nginx spec: ports: - port: 80 name: web clusterIP: None # 关键:无集群 IP,仅提供 DNS 解析 selector: app: nginx --- # StatefulSet 配置:2 个副本 + 1Gi 持久存储 apiVersion: apps/v1beta1 kind: StatefulSet metadata: name: web spec: serviceName: "nginx" # 关联 Headless Service replicas: 2 template: metadata: labels: app: nginx spec: containers: - name: nginx image: gcr.io/google_containers/nginx-slim:0.8 ports: - containerPort: 80 name: web volumeMounts: - name: www # 与 volumeClaimTemplates 名称一致 mountPath: /usr/share/nginx/html # 持久存储模板:自动为每个 Pod 创建 PVC volumeClaimTemplates: - metadata: name: www spec: accessModes: [ "ReadWriteOnce" ] # 单节点读写 resources: requests: storage: 1Gi3.2 执行创建命令
- 打开两个终端窗口:
- 终端 1(监控 Pod 状态):
kubectl get pods -w -l app=nginx- 终端 2(执行创建操作):
kubectl create -f web.yaml # 输出: # service "nginx" created # statefulset "web" created- 验证创建结果:
# 查看 Headless Service kubectl get service nginx # 输出:NAME CLUSTER-IP EXTERNAL-IP PORT(S) AGE # nginx None > 80/TCP 12s # 查看 StatefulSet kubectl get statefulset web # 输出:NAME DESIRED CURRENT AGE # web 2 2 30s3.3 关键现象:有序创建 Pod
终端 1 监控到的 Pod 创建顺序:
web-0 0/1 Pending 0 0s web-0 1/1 Running 0 19s # 先启动 web-0 web-1 0/1 Pending 0 0s web-1 1/1 Running 0 18s # web-0 就绪后启动 web-1核心特性:StatefulSet 按
0→1→N-1顺序创建 Pod,前一个就绪后才启动下一个。
四、实战步骤 2:验证 StatefulSet 核心特性
4.1 验证稳定网络标识
每个 Pod 拥有固定主机名和 DNS 地址:
# 1. 查看 Pod 主机名(固定为 <statefulset 名称>-<序号>) for i in 0 1; do kubectl exec web-$i -- sh -c 'hostname'; done # 输出: # web-0 # web-1 # 2. 验证集群内 DNS 解析(使用 dnsutils 容器) kubectl run -i --tty --image busybox dns-test --restart=Never --rm /bin/sh # 执行 nslookup: nslookup web-0.nginx # 输出:Address 1: 10.244.1.6 web-0.nginx.default.svc.cluster.local nslookup web-1.nginx # 输出:Address 1: 10.244.2.6 web-1.nginx.default.svc.cluster.local关键结论:即使 Pod 重建,主机名和 DNS 地址不变,仅 IP 可能更新。
4.2 验证稳定持久存储
数据不随 Pod 重建丢失:
# 1. 向每个 Pod 的存储写入主机名(模拟业务数据) for i in 0 1; do kubectl exec web-$i -- sh -c 'echo $(hostname) > /usr/share/nginx/html/index.html'; done # 2. 验证数据写入成功 for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done # 输出: # web-0 # web-1 # 3. 删除所有 Pod,观察重建后数据是否保留 kubectl delete pod -l app=nginx # 等待 Pod 重建完成后,再次验证: for i in 0 1; do kubectl exec -it web-$i -- curl localhost; done # 输出仍为 web-0、web-1,数据未丢失!核心特性:每个 Pod 绑定独立 PV,删除 Pod 后 PV 不删除,重建后自动挂载。
五、实战步骤 3:常用运维操作(扩容 / 缩容 / 更新 / 删除)
5.1 扩容 StatefulSet(从 2 到 5 个副本)
# 终端 1 监控 Pod 状态:kubectl get pods -w -l app=nginx # 终端 2 执行扩容: kubectl scale sts web --replicas=5 # 输出:statefulset "web" scaled关键现象:按2→3→4顺序创建 Pod,每个 Pod 就绪后才启动下一个。
5.2 缩容 StatefulSet(从 5 到 3 个副本)
# 终端 1 监控 Pod 状态 # 终端 2 执行缩容: kubectl patch sts web -p '{"spec":{"replicas":3}}' # 输出:"web" patched关键现象:按4→3反向顺序删除 Pod,前一个 Pod 完全终止后才删除下一个。
5.3 更新 StatefulSet(镜像版本升级)
StatefulSet 支持两种更新策略,实操如下:
策略 1:OnDelete(默认,手动触发更新)
# 1. 修改镜像版本(从 0.8 到 0.7) kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]' # 2. 手动删除 Pod,触发更新(仅删除的 Pod 会更新) kubectl delete pod web-0 web-1 web-2 # 3. 验证更新结果 kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}' # 输出:所有 Pod 镜像已更新为 0.7策略 2:RollingUpdate(自动滚动更新)
# 1. 配置滚动更新策略 kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate"}}}' # 2. 修改镜像版本(从 0.7 回滚到 0.8) kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.8"}]' # 3. 监控更新过程(反向顺序:web-2→web-1→web-0) kubectl get po -l app=nginx -w高级操作:分区更新(金丝雀发布)
仅更新序号 ≥ partition 的 Pod:
# 1. 配置分区(仅更新序号 ≥2 的 Pod,即 web-2) kubectl patch statefulset web -p '{"spec":{"updateStrategy":{"type":"RollingUpdate","rollingUpdate":{"partition":2}}}}' # 2. 修改镜像版本,仅 web-2 会更新 kubectl patch statefulset web --type='json' -p='[{"op": "replace", "path": "/spec/template/spec/containers/0/image", "value":"gcr.io/google_containers/nginx-slim:0.7"}]' # 3. 验证结果(仅 web-2 为 0.7,其余为 0.8) kubectl get pod -l app=nginx -o jsonpath='{range .items[*]}{.metadata.name}{"t"}{.spec.containers[0].image}{"n"}{end}'5.4 删除 StatefulSet
方式 1:非级联删除(仅删 StatefulSet,保留 Pod 和 PV)
kubectl delete statefulset web --cascade=false # 验证:Pod 仍运行,PV 保留 kubectl get pods -l app=nginx kubectl get pvc -l app=nginx方式 2:级联删除(删 StatefulSet + Pod,保留 PV)
kubectl delete statefulset web # 验证:Pod 按反向顺序删除,PV 仍存在 kubectl get pods -l app=nginx # 无输出 kubectl get pvc -l app=nginx # 仍显示绑定状态 # 手动删除 Headless Service(级联删除不会删 Service) kubectl delete service nginx六、关键配置与生产实践总结
| 操作类型 | 核心命令 / 配置 | 关键注意事项 |
|---|---|---|
| 创建 | kubectl create -f web.yaml | 必须先创建 Headless Service |
| 扩容 / 缩容 | kubectl scale sts plicas=N | 有序扩容、反向缩容,依赖前驱 Pod 就绪 |
| 版本更新 | RollingUpdate/OnDelete | 生产环境优先用RollingUpdate,支持回滚 |
| 金丝雀发布 | partition: N | 仅更新序号 ≥N 的 Pod,适合灰度验证 |
| 删除 | --cascade=false/ 默认 | PV 永远不会自动删除,需手动清理无用 PV |
| 数据持久化 | volumeClaimTemplates | 确保 StorageClass 已配置,避免 PVC Pending |
七、核心结论
StatefulSet 的核心价值是稳定标识 + 持久存储 + 有序操作,专为数据库、缓存等有状态服务设计;
运维关键:牢记「有序创建 / 缩容 / 更新」特性,避免强制终止 Pod 导致数据不一致;
存储管理:删除 StatefulSet 后,需手动清理无用 PV,避免存储资源浪费;
更新策略:生产环境优先使用
RollingUpdate + partition,实现安全的灰度发布和版本回滚。
通过本文实操,可快速掌握 StatefulSet 从部署到运维的全流程,直接复用命令和配置到生产环境。
