当前位置: 首页 > news >正文

MRC(多路径可靠连接)协议

OpenAI牵头:AMD、NVIDIA、Intel、微软、博通巨头罕见联手! 终于把AI网络层搞定

OpenAI通过开放计算项目(OCP)正式发布MRC(多路径可靠连接)协议,解决大规模AI训练中的GPU网络通信瓶颈。

该协议由OpenAI与AMD、NVIDIA、Intel、微软和博通历时两年联合开发,目前已在搭载NVIDIA GB200的超算集群中投入实际使用。

MRC要解决的核心问题是:在训练大规模AI模型时,单次数据传输延迟就足以导致整个训练过程中断,GPU集体空转等待,而集群规模越大,由网络拥塞、链路和设备故障引发的延迟问题越频繁。

MRC的方案是将单条800Gb/s网络接口拆分为多条更小的链路,例如将一个接口连接至8台不同交换机,构建8条独立的100Gb/s并行网络,而非依赖单一800Gb/s网络。

这一改变对集群拓扑结构的影响极为明显,一台支持64个800 Gb/s端口的交换机,在拆分后可连接512个100 Gb/s端口,使得仅用两层交换机即可实现约13.1万块GPU的全互联网络。

传统800 Gb/s方案则需要三到四层交换机才能达到同等规模,层数减少直接意味着延迟降低和故障点减少。

MRC基于现有的RDMA over RoCE(融合以太网)协议扩展,支持GPU和CPU的硬件加速远程直接内存访问。

OpenAI已在Oracle Cloud Infrastructure和微软Fairwater超算上的GB200集群中部署MRC,用于训练前沿模型。

该协议也将成为OpenAI正在建设的Stargate超算的基础网络架构,该超算目标在2029年部署10GW AI算力,过去三个月已部署超过3GW。

MRC协议还向整个AI行业开放,OpenAI表示希望借此推动跨行业协作,共同解决AI基础设施中最棘手的网络难题。

http://www.jsqmd.com/news/780336/

相关文章:

  • Product Hunt 每日热榜 | 2026-05-08
  • 一键安装 OpenClaw 全程图文教程 | 无需命令行
  • Figma中文界面插件:让全球顶尖设计工具真正为你所用
  • 基于MCP协议构建苹果官方文档智能查询系统
  • 头歌MySQL-基于电影、演员及票房应用的数据查询(Select)
  • 顶俏模式商城系统开发 单层直推积分流转架构解析
  • ARM链接器核心概念与优化实践指南
  • GEO优化干货分享:GEO品牌优化很重要,请收藏!
  • 1瓦x86处理器在嵌入式系统的低功耗实战
  • JAVA-实战8 Redis实战项目—雷神点评(12)UV统计
  • 传奇游戏|热血传奇|复古传奇|电脑版传奇网页游戏|复古传奇游戏玩与攻略|602游戏剖析
  • 嵌入式系统电源优化:CMOS功耗分析与DVFS技术实践
  • AI编程助手高效配置指南:Cursor与Claude Code专属工具箱实战
  • Ubuntu下载地址
  • 从2D到3D NAND:存储技术演进、控制器挑战与未来展望
  • Qoder Reset工具:彻底清除AI编程助手本地身份与指纹数据
  • Redis别再只当缓存用!8种常用数据结构+实战选型,一看就会
  • Suno Style API 集成教程
  • 从硬连线到软定义:可编程逻辑器件(PAL/CPLD/FPGA)演进史与技术解析
  • 开关电源环路补偿设计:驯服两级LC滤波器的相位滞后
  • 案例之 逻辑回归_电信用户流失预测
  • 【光学】矩阵传输的多模光纤仿真与建模【含Matlab源码 15417期】
  • 强烈推荐一个轻量可嵌入的 .NET 向量数据库:SharpVector
  • QT下载并安装
  • KES数据库安全、权限、审计实战
  • 智能体基准测试框架Agent-Harness:从评估到改进的工程实践
  • AI智能体数据压缩与安全审计:Liquefy的领域感知引擎与主动防护
  • 高性能MCP服务器实战:AI应用通信优化与性能调优指南
  • ARM浮点转整数指令VCVTA原理与应用详解
  • 基于 C# 的轻量级离线工业语音播报方案