当前位置: 首页 > news >正文

Red Hat为英伟达Vera Rubin AI平台定制RHEL操作系统

基于与芯片公司的持续合作伙伴关系,Red Hat承诺为英伟达新发布的Vera Rubin平台提供"第0天"支持,该平台将于今年晚些时候发布。

这家企业开源软件公司旨在缩小英伟达硬件平台发布与其自有支持软件堆栈正式发布之间的时间差,为Rubin平台设计了其旗舰操作系统Red Hat Enterprise Linux(RHEL)的定制版本。

英伟达的Vera Rubin平台旨在降低AI推理成本。该平台基于新的CPU、GPU和数字处理单元(DPU)构建,所有组件都与其他组件紧密集成。

据Red Hat发言人透露,该平台和Red Hat的软件都预计在2026年下半年推出。

当Rubin平台发布时,Red Hat存储库将提供经过验证的英伟达GPU OpenRM驱动程序和CUDA工具包。

Red Hat的软件还能够在英伟达新发布的机密计算安全架构框架内运行AI生命周期,该架构提供工作负载保护的加密证明。

除了RHEL,Red Hat还将为Rubin发布适用于Kubernetes的Red Hat OpenShift平台,Red Hat AI平台将扩展对分布式推理的支持,在Red Hat AI推理服务器、Red Hat Enterprise Linux AI和Red Hat OpenShift AI上支持英伟达的开源模型。

英伟达首席执行官黄仁勋在2025年消费电子展(CES)的主题演讲中介绍了Vera Rubin。该平台以美国天文学家薇拉·弗洛伦斯·库珀·鲁宾命名,她发现了占据宇宙大部分空间的暗物质。

这个平台承担着另一项艰难使命:降低运行大规模AI推理工作负载不断飙升的计算成本和电力使用成本。

通过工程化设计使组件更紧密地协同工作,Vera Rubin可以将训练模型的推理Token成本降低10倍,同时比传统用于此类任务的英伟达Blackwell平台少使用4倍的GPU。

该平台的以太网光子交换系统还承诺提供5倍的功耗效率改进。

Vera是该平台88核CPU的名称,Rubin是GPU的名称,提供50 PFLOPs的数学计算能力(是Blackwell的5倍)。英伟达BlueField-4 DPU还提供进一步的计算加速。这些处理单元都与NVLink 6交换机、英伟达ConnectX-9 SuperNIC和英伟达Spectrum-6以太网交换机紧密结合——所有这些都采用英伟达芯片制造。

随着公司加大AI投入,他们发现通过GPU最高效完成的推理工作成本越来越高。

本周,亚马逊云服务(AWS)将其GPU成本上调了15%。

推理成本确实一直是英伟达高管关注的问题。该公司还与Groq签署了200亿美元的推理和编译器技术许可协议。

在主题演讲中,英伟达的黄仁勋谈到了最近AI系统中推理使用的急剧增加。不仅模型本身变得更大,推理量本身也急剧增长。推理不再用于产生单一的"一次性"答案,而是一个"思考过程",通常涉及多个模型和额外的后训练。

因此需要更多推理计算。

"现在有强化学习,本质上是计算机尝试不同迭代学习如何执行任务,"黄仁勋说。"预训练、后训练、测试时扩展的计算量因此爆炸性增长。"

Anthropic联合创始人兼首席执行官Dario Amodei在声明中指出:"英伟达Rubin平台的效率提升代表了那种能够实现更长记忆、更好推理和更可靠输出的基础设施进步。"

除了Red Hat(隶属于IBM),其他承诺支持Rubin平台的公司还包括:AWS、Anthropic、思科、CoreWeave、戴尔、谷歌、HPE、Lambda、联想、Meta、微软、Mistral AI、OpenAI、甲骨文云基础设施(OCI)等众多公司。

Q&A

Q1:Vera Rubin平台是什么?有什么特别之处?

A:Vera Rubin是英伟达新发布的AI平台,专门用于降低AI推理成本。该平台基于新的CPU、GPU和数字处理单元构建,通过紧密集成的组件设计,可以将训练模型的推理Token成本降低10倍,同时比传统Blackwell平台少使用4倍GPU。

Q2:Red Hat为Vera Rubin平台提供什么支持?

A:Red Hat承诺为Vera Rubin平台提供"第0天"支持,包括定制版本的RHEL操作系统、经过验证的英伟达GPU OpenRM驱动程序和CUDA工具包。还将发布适用于Kubernetes的Red Hat OpenShift平台,并扩展Red Hat AI平台对分布式推理的支持。

Q3:Vera Rubin平台什么时候能够使用?

A:根据Red Hat发言人透露,Vera Rubin平台和Red Hat的配套软件都预计在2026年下半年正式推出。目前已有AWS、谷歌、微软、OpenAI等众多公司承诺支持该平台。


http://www.jsqmd.com/news/240209/

相关文章:

  • 8年前端,才明白生活/工作是个缓慢受锤的过程!
  • 支持100+平台!多平台视频下载工具!全网视频一键下载
  • 从“哭哭马”爆红,解锁跨境选品新思路
  • 将三国演义中曹操献刀改编成游戏,让你身临其境的感觉到那位乱世枭雄在生死边缘游走时的挣扎和绝决!它不仅是游戏,更是一次穿越时空的历史体验!
  • 谷歌发布用于智能体购物的新协议标准
  • 英国重夺全球金融科技投资排名第二位
  • 好用,高效NAS管理!比 Sun-Panel 还好用的导航页?
  • 泛素连接酶STUB1调控干扰素γ受体稳定性及其在肿瘤免疫中的功能
  • 学霸同款2026 TOP8 AI论文网站:专科生毕业论文神器测评
  • 拆解 DDoS 攻击套路:抗 D 防护的主动防御与应急响应机制
  • 全链路开发指南:DApp+公链+钱包+Swap 如何打通?
  • Videojet如何让技术与战略深度融合推动业务增长
  • 转行月入10K+的人,背后是付出怎么样的努力呢?
  • 高防 IP 核心技术揭秘:流量清洗、黑洞路由、BGP 多线,底层逻辑拆解
  • 如何像使用Openai API那样使用豆包的图片和视频API
  • 财务管理专业兼职忙到飞起?提前准备这2项能力,兼顾赚钱与提升
  • 开发者首选:2025年最受推荐的3大CAPTCHA解决方案
  • Anthropic推出Claude医疗版AI,可安全接入健康记录
  • 拥有PMP证书等于拥有“人才绿卡”
  • 2026年网络安全相关专业就业,零基础入门到精通,看这一篇分析就够了
  • 高质量电缆输送机,电缆敷设方案提升专家
  • 物理AI成为下一个前沿:已经融入我们的日常生活
  • Guava Cache 原理与实战
  • 机器学习工程师证书:智能制造时代入门票
  • 安达发|当APS计划排产排程排单软件,遇上最硬核的煤炭排程
  • 自变量机器人获10亿融资,开源千寻模型登顶全球,欧姆龙升级工业机器人,OpenAI与丰田合作车载场景
  • 基于PLC的污水处理系统 程序文件 文档资料(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)
  • Godot:独立开发者的开源超能力
  • 脑机接口行业发展报告:政策加码,临床加速,产业化进入关键阶段
  • 如何用耐达讯自动化Profibus总线光纤中继器解决变频器长距离通信干扰问题?