当前位置: 首页 > news >正文

Debian 13 (PVE内核) 下 Intel e1000e 网卡间歇性 “Hardware Unit Hang” 断网问题原因与解决

⚠️ 本文大量引用自鱼丸粗面的这篇文章

我的网卡是I217-LM,用的是e1000e的驱动,故障日志为:

Apr 26 16:03:44 pve kernel: e1000e 0000:00:19.0 nic0: NIC Link is Down
Apr 26 16:03:44 pve kernel: vmbr0: port 1(nic0) entered disabled state
Apr 26 16:03:47 pve kernel: e1000e 0000:00:19.0 nic0: NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
Apr 26 16:03:47 pve kernel: vmbr0: port 1(nic0) entered blocking state
Apr 26 16:03:47 pve kernel: vmbr0: port 1(nic0) entered forwarding state
Apr 26 16:04:07 pve kernel: e1000e 0000:00:19.0 nic0: Detected Hardware Unit Hang:
TDH <0>
TDT <3>
next_to_use <3>
next_to_clean <0>
buffer_info[next_to_clean]:
time_stamp <105cdabd7>
next_to_watch <0>
jiffies <105cdb6c0>
next_to_watch.status <0>
MAC Status <80083>
PHY Status <796d>
PHY 1000BASE-T Status <3800>
PHY Extended Status <3000>
PCI Status <10>
Apr 26 16:04:08 pve kernel: e1000e 0000:00:19.0 nic0: NIC Link is Down

故障原因

这是 Linux 内核中 e1000e 驱动的一个经典 Bug,在较新的内核版本(尤其是 5.15+ 到 6.x)配合特定批次的 Intel I219 系列网卡时极易触发。

网卡的 TCP 分段卸载 (TSO, TCP Segmentation Offload) 和通用分段卸载 (GSO) 功能在处理高并发或特定数据包时,可能导致网卡的环形缓冲区 (Ring Buffer) 指针计算错误或死锁,导致网卡硬件挂起并尝试重置。

解决方案

以我的网卡名nic0为例

临时

sudo ethtool -K nic0 tso off gso off gro off

持久化

编辑/etc/network/interfaces

auto lo
iface lo inet loopbackiface nic0 inet manualpost-up /usr/sbin/ethtool -K nic0 tso off gso off gro off #在你的网卡模块下添加此行,注意tab。iface nic1 inet manualauto vmbr0
iface vmbr0 inet staticaddress 192.168.10.200/24gateway 192.168.10.1bridge-ports nic0bridge-stp offbridge-fd 0source /etc/network/interfaces.d/*

补充

如果关闭 Offload 后仍偶发断网,可能是电源管理 (ASPM) 问题。可修改 GRUB 配置:

  1. 编辑 /etc/default/grub,在 GRUB_CMDLINE_LINUX_DEFAULT 中追加:pcie_aspm=off
  2. 更新 GRUB:update-grub
http://www.jsqmd.com/news/704267/

相关文章:

  • 构建创业项目自动化评估系统:从数据采集到智能推荐的技术实践
  • OmniParser:统一模型框架解析复杂文档,实现文本、表格、公式一体化识别
  • Visual C++运行库合集:Windows应用生态的“万能钥匙“解密
  • Moonlight TV:如何用开源方案实现30ms低延迟游戏串流?
  • 如何用Untrunc轻松修复损坏视频:终极免费恢复指南
  • 2025-2026年北京奔驰专修中心推荐:口碑好的服务解决保养费用高性价比特点 - 品牌推荐
  • 你的模型调优只差这一步:深入理解sklearn中GridSearchCV的cv_results_属性怎么用
  • 2025-2026年航城壹号电话查询:购房前需核实房源与合同细节 - 品牌推荐
  • 3步构建企业级元数据管理平台:OpenMetadata本地部署完全指南
  • 2025-2026年金程考研电话查询:选择辅导课程前请先核实资质 - 品牌推荐
  • 一条慢 SQL,是如何引发 Kafka 全站“假死”的?
  • 如何在5分钟内完成BepInEx插件框架的完整安装指南
  • 2025-2026年北京奔驰专修中心推荐:口碑好的服务解决商务接待空调制冷不足问题 - 品牌推荐
  • ChatGPT代码解释器实战指南:从数据可视化到自动化办公
  • 国产ZYNQ平替怎么选?深度对比复旦微FMQL20S400与Xilinx ZYNQ7020核心板
  • 3大突破性技术让LLM提示词优化节省90%API成本
  • 2025-2026年金程考研电话查询:选择辅导前请核实资质与合同条款 - 品牌推荐
  • MCP 2026国产化迁移失败率骤降83%的关键配置(工信部信创评估组内部验证的5项强制校验项首次公开)
  • 2025-2026年北京奔驰专修中心推荐:口碑好的服务应对通勤途中仪表盘报警注意事项 - 品牌推荐
  • WaveDrom:5个技巧快速掌握专业数字时序图生成器
  • 3个场景,1个工具:Visual C++运行库合集彻底解决Windows应用程序依赖问题
  • YOLO四种常见的关键点数据集说明
  • 城通网盘福利
  • Switch手柄在PC上完美工作的终极指南:BetterJoy解决方案全解析
  • 2025-2026年北京奔驰专修中心推荐:口碑好的服务解决保养维护时价格不透明导致担忧 - 品牌推荐
  • 零信任AI开发环境构建全指南,从Dockerfile硬隔离到OPA策略引擎落地
  • 基于LangGraph与Gemini构建具备规划-执行-反思能力的智能研究助手
  • KISSABC官方购买指南 - 品牌企业推荐师(官方)
  • Git04-同步1-3:在feat/B分支上同步origin/main新代码【rebase详解:本地有未提交代码时,如何安全 rebase 到最新 main 分支继续开发】
  • 高质量的OPCServer DA版本:C#二次开发源码,多行业应用,稳定可靠,含测试源码与视频教程