当前位置: 首页 > news >正文

141. PLEG is not healthy 问题

  • A node in your environment is responding erratically, switching between "active" and "unavailable" states, reporting aNotReadystatus with a "PLEG is not healthy" message.
    你环境中的某个节点响应不稳定,在“活跃”和“不可用”状态之间切换,报告“NotReady”状态并提示“PLEG 不健康”。
  • In the kubelet logs, you can find many messages like this:
    在 kubelet 日志中,你可以找到许多类似这样的消息:
    E0830 10:36:49.162629 3137 kubelet.go:2040] "Skipping pod synchronization" err="PLEG is not healthy: pleg was last seen active 3m3.978055897s ago; threshold is 3m0s"
    E0830 10:36:49.162629 3137 kubelet.go:2040] “跳过舱体同步” err=“PLEG 不健康:Pleg 最后一次被发现活跃于 3 分 3.97805897 秒前;阈值是 3m0 秒”
Resolution 结局

A potential quick fix to make your node available again could be restarting the affected services: restart kubelet, the container runtime, or even the whole node.
一个可能的快速解决方案是重启受影响的服务:重启 Kubelet、容器运行时,甚至整个节点。

However, this will only be a temporary solution, as the root of the issue will still be present and could lead you to hit the error again in the future. As the "PLEG is not healthy" issue can have multiple origins, it will need a root cause analysis to understand what exactly triggered the issue on the first place.
不过这只是暂时的解决方案,问题根源依然存在,可能导致你将来再次遇到错误。由于“PLEG 不健康”的问题可能有多个起因,因此需要进行根本原因分析,以确定最初是什么引发了这个问题。

As a lack of resources is the most common trigger, there are a few recommended actions that can help to avoid this problem:
由于资源匮乏是最常见的诱因,以下是一些建议的措施可以帮助避免此问题:

  • Set up a memory reservation for the kubelet and the operating system at a cluster level. You can find the steps on how to do so in this KB article.
    在集群层面为 kubelet 和操作系统设置内存预留。你可以在这篇知识基础文章中找到相关步骤。
  • Make sure there are enough workers to host all application workloads.
    确保有足够的工人来承载所有应用工作负载。
  • Optional/recommended: establish request/limits.
    可选/推荐:设定请求/限制 。
Cause 病因

A "PLEG is not healthy" error in Kubernetes indicates the kubelet on a node cannot communicate with the Container Runtime (like contained or Docker), which disrupts the whole pod lifecycle management.
Kubernetes 中的“PLEG is not healthy”错误表示节点上的 kubelet 无法与容器运行时(如 contained 或 Docker)通信,这会干扰整个 Pod 生命周期管理。

There may be multiple reasons behind an unhealthy PLEG error, but the most common are:
不良 PLEG 错误可能有多种原因,但最常见的有:

  • High System Load: Excessive CPU, memory, or disk I/O on the node makes the container runtime unresponsive.
    高系统负载:节点上的过多 CPU、内存或磁盘 I/O 会导致容器运行时无响应。
  • Security Software Interference: Host-based firewalls or IDS/IPS might block communication between the kubelet and the container runtime socket.
    安全软件干扰:基于主机的防火墙或 IDS/IPS 可能阻止 kubelet 与容器运行时套接字之间的通信。
  • Bugs in certain older versions of the container runtime/kubelet versions (less common).
    某些较旧版本的容器运行时/kubelet 版本存在 bug(较少见)。
Additional Information 附加信息
  • Kubernetes documentation on resource reservations for system daemonsKubernetes 关于系统守护进程资源预留的文档
  • SUSE KB article on system-reserved and kube-reserved resource reservationsSUSE KB 关于系统预留和库比预留资源预留的文章
Environment 环境

A Kubernetes cluster, running any distribution (e.g., RKE2, k3s).
一个 Kubernetes 集群,运行任意发行版(例如 RKE2、k3s)。

访问Rancher-K8S解决方案博主,企业合作伙伴 :
https://blog.csdn.net/lidw2009

http://www.jsqmd.com/news/680308/

相关文章:

  • MCNP新手避坑指南:用Fmesh卡计算钴-60源剂量当量,从几何建模到结果可视化的完整流程
  • 软件测试工程师的35岁破局之道:构建技术与管理双轨制晋升体系
  • 别再死记硬背AHP公式了!用Excel+Python 5分钟搞定数学建模里的权重计算
  • 手机号逆向查询QQ号:3步高效解决方案完整指南
  • 从“完美”执念到“价值”觉醒:一位测试工程师的3000用例优化心路
  • 逆向思维学PWN:通过GDB调试实战,动态理解寄存器与栈的变化
  • Docker 27网络策略升级全貌(隔离能力提升270%?内测数据首次公开)
  • 143. Rancher 支持 Docker 吗?
  • 告别U-Net独大?手把手带你用PyTorch和MONAI复现UNETR,搞定3D医学图像分割
  • GLM-TTS流式推理体验:低延迟实时语音合成,打造交互式应用
  • 避开这些坑!ESP32-CAM驱动舵机时GPIO冲突与电源问题的实战解决
  • 智能门锁加盟哪家好?2026智能门锁加盟/智能指纹锁源头厂家/口碑品牌优选推荐 - 栗子测评
  • 从一颗1N4148说起:在老式收音机里,我是如何发现并修复温度漂移故障的
  • 2026年口碑好的气源处理/气源处理过滤减压阀优质公司推荐 - 行业平台推荐
  • 【仅限内部团队流传】:Docker daemon.json中隐藏的ai-scheduler参数(max-concurrent-builds=0竟导致LLM微调中断)
  • 2026国内动作捕捉技术公司/模拟训练方案源头厂家推荐:电磁动捕设备/电磁定位系统/电磁数据手套/光学动捕设备定制厂家 - 栗子测评
  • 深度学习 —— 损失函数
  • 2026年比较好的机制路边石/滑县路边石/透水路边石批量采购厂家推荐 - 品牌宣传支持者
  • 第二篇:《主流UI自动化工具横向对比:Selenium、Cypress、Playwright、Puppeteer》
  • AudioLDM-S音效生成质量评测:CNN与人类听觉对比实验
  • 2026年靠谱的贵州现货办公家具/贵州新款办公家具厂家对比推荐 - 行业平台推荐
  • 仅限首批医疗客户开放:Dify v0.12.3医疗增强版安全模块配置密钥(含FHIR接口动态鉴权+OCR结果水印策略)
  • 用东华OJ的50道基础题,带你系统掌握C++核心语法与算法思想
  • Phi-4-mini-reasoning基础教程:Python调用transformers加载FP16模型完整步骤
  • 2026年Q2宁波太阳能维修怎么选:镇海区热水维修、镇海区空调维修、奉化区热水器维修、宁波中央空调维修、宁波制冰机维修选择指南 - 优质品牌商家
  • 2026年防雷工程全解析:防雷装置检测、防雷设施检测、专业防雷检测、避雷塔检测、避雷工程、避雷带检测、避雷施工选择指南 - 优质品牌商家
  • CVPR 2026上的即插即用模块
  • 2026台州混合肌玻尿酸注射技术要点及术后护理指南:台州油性肌玻尿酸、台州混合肌水光针、台州混合肌玻尿酸、台州玻尿酸选择指南 - 优质品牌商家
  • 2026年热门的安徽扩散硅压力变送器/扩散硅压力变送器/不锈钢壳体压力变送器厂家综合对比分析 - 行业平台推荐
  • 告别SD卡!在RT-Thread上玩转eMMC:从驱动调试到文件系统性能对比全解析