当前位置: 首页 > news >正文

InfiniBand 网络管理探秘:子网管理器如何发现硬件并分配网络地址

在现代高性能计算和数据中心中,InfiniBand 网络凭借其超低延迟和高吞吐量成为关键基础设施。然而,一个高效网络的运行离不开精密的"交通管理系统"——子网管理器(Subnet Manager,SM)。今天,我们将深入探索 SM 如何从零开始,发现网络中的所有硬件设备,并为它们分配唯一的网络地址(LID),最终构建起一个有序、高效的通信网络。

启程:黑暗中的第一声呼唤

想象一下,你被空投到一个完全黑暗、未知的房间里,房间里布满了各种设备,但你看不见它们,也不知道它们如何连接。这就是 InfiniBand 子网管理器启动时面临的处境。SM 首先要回答两个基本问题:网络里有什么设备?它们如何连接?

SM 的探索之旅从广播发现开始。它向特殊的广播地址 LID 0xFFFF 发送第一声呼唤——一个 SubnGet 管理数据报(MAD),查询最基本的节点信息(NodeInfo)。这个广播报文会被网络中所有 InfiniBand 设备接收到,无论它们是主机通道适配器(HCA)还是交换机。

每个 InfiniBand 设备内部都有一个子网管理代理(SMA),这是一个固件层面的智能应答器。当 SMA 听到这声广播呼唤时,它会立即响应,通过 SubnGetResp 报文告诉 SM:“我在这里!我是 HCA/交换机,我有 X 个端口,我的唯一身份 GUID 是 YYYY…”

有趣的是,在这个初始阶段,设备还没有正式的"门牌号"(LID),但它们仍然能够响应。它们使用 SM 的源 LID(通常是 0x0000)作为返回地址,就像在信封上写上"回复给:网络管理

http://www.jsqmd.com/news/155381/

相关文章:

  • GEO贴牌代理赋能AI搜索推荐,让品牌在智能问答中优先展现 - 源码云科技
  • YOLO模型灰度版本监控大盘:一站式观测核心指标
  • YOLO模型灰度发布期间紧急问题响应机制
  • 最近很火,你却不懂的新梗
  • YOLO与Spinnaker部署平台集成:多环境渐进式发布
  • YOLO模型训练任务依赖管理:有向无环图调度实现
  • YOLO模型灰度发布回滚演练:定期检验应急预案
  • YOLO模型灰度版本灰度结束后的用户通知
  • 计算机毕业设计Python+AI大模型新闻自动分类 新闻预测系统 新闻可视化 新闻爬虫 大数据毕业设计
  • Abaqus复合材料微观单胞RVE模型的周期性网格划分及E11,E22,E33,G12,G13...
  • 在微网的世界里,电能共享是个大话题。今天咱们聊聊如何用非对称纳什谈判来优化多微网间的电能共享,顺便加点代码,让大家感受一下这个高级玩意儿
  • 基于Matlab的MLP多层感知机多输入多输出预测:处理数据集与评估性能
  • YOLO与Kyverno策略引擎集成:K8s安全合规校验
  • 计算机毕业设计Python+AI大模型智能路线规划数据分析与个性化推荐系统 旅游路线推荐系统 旅游路线规划系统 大数据毕业设计
  • YOLO模型缓存雪崩防范:随机过期时间设置技巧
  • 考虑异质偏好的微网/产消者P2P分布式能源交易机制-100%原创代码 摘要:本代码主要做的是分...
  • YOLO目标检测中的注意力机制引入:提升特征提取能力
  • GDKOI 2025 游记
  • YOLO与Argo CD持续交付集成:GitOps模式实践
  • YOLO与Knative无服务器集成:实现事件驱动的推理
  • YOLO目标检测中的小目标识别难题破解思路
  • 新手指南之大纲设定(飞卢)
  • 梨忆
  • YOLO模型灰度发布期间用户反馈收集机制
  • YOLO模型灰度版本灰度比例动态调整策略
  • YOLO与Grafana Loki日志聚合集成:高效查询海量日志
  • YOLO与Kiali服务拓扑可视化集成:直观查看调用关系
  • YOLO模型灰度版本灰度范围扩展策略
  • YOLO在高速公路监控的应用:违章停车自动抓拍
  • 打卡信奥刷题(2604)用C++实现信奥题 P2441 角色属性树