当前位置: 首页 > news >正文

英伟达AI Compute Partnership:从“卖铲人“到“收租人“的算力金融化革命

引言:GPU皇帝的"中央银行"时刻

2026年7月1日,英伟达正式宣布推出AI Compute Partnership Program——以收入分成(Revenue-sharing)和信用支持(Credit-support)双机制为核心的AI基础设施合作新模式。

同一天,Meta被曝计划推出云基础设施业务向外部出售算力,引发半导体板块暴跌6%。截然相反的市场信号两相映照,勾勒出AI算力产业最深层的结构性变革:英伟达正在从"铲子供应商"变成算力世界的"中央银行"

更直白地说:英伟达不再只满足于把GPU卖给你,它要参与你每一次算力出租的利润分成。


一、新模式全景:英伟达的算力金融化双引擎

1.1 双机制架构

┌──────────────────────────────────────────────────────────┐ │ NVIDIA AI Compute Partnership Program │ │ │ │ ┌─────────────────────────┐ ┌─────────────────────────┐ │ │ │ 收入分成机制 │ │ 信用支持机制 │ │ │ │ Revenue-sharing │ │ Credit-support │ │ │ ├─────────────────────────┤ ├─────────────────────────┤ │ │ │ 英伟达从云服务商营收中 │ │ 英伟达利用自身资产负债 │ │ │ │ 抽取约定比例的分成收入 │ │ 表为新兴云厂商提供财务 │ │ │ │ 分成比例随合同期推进 │ │ 担保和算力信用额度 │ │ │ │ 逐步阶梯递减 │ │ 降低初始CapEx门槛 │ │ │ └─────────────────────────┘ └─────────────────────────┘ │ │ │ │ 核心条款(The Information披露) │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 若云服务商无法找到足够租户 → 英伟达以约定价格回租 │ │ │ │ 未售出的GPU产能 │ │ │ │ │ │ │ │ 等价于:英伟达用自己的资产负债表为算力需求兜底 │ │ │ └──────────────────────────────────────────────────────┘ │ │ │ │ 底层架构:DSX AI Factory │ │ - 基于NVIDIA DSX数据中心平台 │ │ - 大规模多租户AI工厂设计 │ │ - 原生支持Blackwell系列GPU(GB300) │ └──────────────────────────────────────────────────────────┘

1.2 首批合作伙伴

合作伙伴地区部署规模电力规划
Sharon AI澳大利亚(纳斯达克上市)最高40,000块GB300 GPU(远期>55,000)
Firmus印度尼西亚·巴淡岛最高170,000块英伟达GPU360 MW可扩展园区

1.3 模式对比:从一次性交易到持续性收益

NVIDIA商业模式三重跃迁 ┌──────────────┬───────────────────┬──────────────────────┐ │ 维度 │ 过去 │ 现在 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 角色 │ 硬件供应商 │ 信用中介 + 财务投资者 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 收入来源 │ 一次性芯片销售 │ 持续性使用量挂钩分成 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 风险承担 │ 不承担下游需求 │ 主动承担算力过剩风险 │ │ │ 风险 │ 换取下游利润分成 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 客户关系 │ 卖完即止 │ 长期深度绑定 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 盈利质量 │ 波动性高 │ 经常性收入占比提升 │ └──────────────┴───────────────────┴──────────────────────┘

二、算力供需的真实图景:过剩还是紧缺?

2.1 市场价格信号

英伟达兜底承诺的时机恰好发生在Meta"算力过剩"恐慌引发硬件股暴跌的同一天。但供需数据给出了截然相反的信号:

GPU租赁市场价格走势(2025年10月 → 2026年3月) H100 一年期租赁: $1.70/小时 ───→ $2.35/小时 (+38%) B200 高端GPU租赁: ───→ 涨幅最高94% 所有GPU按需租赁: ───→ 容量100%售罄 高端千卡算力交付周期: ───→ 12-15个月 GPU云端供应商反馈: 供需比 ≈ 1:10(每10个需求只有1个能被满足) 租赁价格半年涨幅 > 25%

2.2 融资障碍 vs 需求不足

新兴云服务商面临的核心障碍不是"算力没人要",而是"没钱买":

算力采购的"鸡生蛋"困境: AI模型团队需要GPU训练模型 ↓ 但GPU太贵,需要云服务商提供算力租赁 ↓ 云服务商需要采购大规模GPU集群 ↓ 但采购需要巨额资本支出(CapEx),银行不愿贷款 ↓ 新兴云服务商信用评级低,融资成本高 ↓ 算力供给无法跟上需求增长 英伟达的解决方案: 用自己的资产负债表为新兴云服务商提供信用增级 → 降低融资门槛 → 加速GPU出货 → 获得持续性分成收益

2.3 Meta卖算力 ≠ 算力过剩

同日Meta被曝计划出售算力,被市场恐慌性解读为"算力过剩"。但细究逻辑:

角度Meta卖算力英伟达兜底
市场反应恐慌性抛售硬件股被忽视的利多信号
隐含判断算力供过于求算力需求确定性极高
深层逻辑Meta CapEx 1250-1450亿美元/年英伟达愿用自有资金为需求兜底
真相Meta需要多元化收入来源融资瓶颈而非需求瓶颈

英伟达用自己的资产负债表为算力需求兜底——如果它对AI算力前景缺乏信心,绝不会做这件事。


三、DSX AI Factory:多租户算力工厂架构

3.1 架构全景

DSX AI Factory是英伟达为大规模算力共享设计的新一代数据中心架构:

┌────────────────────────────────────────────────────────────┐ │ DSX AI Factory 架构 │ │ │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ AI租户A │ │ AI租户B │ │ AI租户C │ ... │ │ │ (训练任务) │ │ (推理服务) │ │ (微调任务) │ │ │ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │ │ │ │ │ │ │ ▼ ▼ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 多租户GPU调度层(Multi-Tenant Scheduler) │ │ │ │ - 动态资源分配 - 优先级队列 - 抢占恢复 │ │ │ │ - 租户隔离 - QoS保障 - 计费计量 │ │ │ └──────────────────────┬───────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ GB300 GPU 算力池(可扩展至17万卡) │ │ │ │ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ │ │ │ │DGX │ │DGX │ │DGX │ │DGX │ │DGX │...│ │ │ │ │SuperPod│SuperPod│SuperPod│SuperPod│SuperPod│ │ │ │ │ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 存储层(NVMe + 分布式并行文件系统) │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 网络层(NVLink + InfiniBand 800G) │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ 供电层:360 MW 可扩展 │ │ 冷却:液冷(直接-to-芯片) │ └────────────────────────────────────────────────────────────┘

3.2 多租户GPU调度器实现

以下是DSX AI Factory核心组件的Go实现——支持资源隔离、动态分配和抢占恢复的多租户调度器:

// DSX AI Factory - Multi-Tenant GPU Scheduler// Core scheduling engine for NVIDIA's AI factory architecturepackageschedulerimport("container/heap""context""fmt""sync""time")// GPU资源单元typeGPUUnitstruct{IDstringModelstring// GB200, GB300, H100, etc.MemoryMBint64ComputeCapfloat64// TFLOPSStatusstring// free, allocated, reserved, maintenancePodIDstring// 所属DGX SuperPodNodeIDstring}// 租户定义typeTenantstruct{IDstringNamestringPriorityint// 优先级(0-100,越高越优先)GuaranteedGPUint// 保证GPU数MaxGPUint// 最大GPU数(弹性上限)BurstEnabledbool// 是否允许突发弹性使用ContractLevelstring// premium, standard, basicRevenueSharefloat64// 收入分成比例}// 任务定义typeTaskstruct{IDstringTenantIDstringTypestring// training, inference, finetuneGPUCountintMinGPUintMaxGPUintDuration time.Duration PriorityintSubmittedAt time.Time Deadline time.Time Preemptiblebool// 是否可被抢占Statestring// queued, running, preempted, completed, failed}// 资源分配记录typeAllocationstruct{TaskIDstringGPUIDs[]stringStartTime time.Time EndTime time.Time Costfloat64// 累计费用}// MultiTenantScheduler 多租户GPU调度器typeMultiTenantSchedulerstruct{mu sync.RWMutex gpuPoolmap[string]*GPUUnit tenantsmap[string]*Tenant taskQueue PriorityQueue runningmap[string]*Allocation metrics*SchedulerMetrics// 调度策略参数config SchedulerConfig}typeSchedulerConfigstruct{OvercommitRatiofloat64// 超分比(默认1.2)PreemptionGrace time.Duration// 抢占宽限期MaxQueueDepthintAccountingPeriod time.Duration// 计费周期}typeSchedulerMetricsstruct{TotalGPUHoursfloat64UtilizationRatefloat64PreemptionCountint64AvgQueueWaitTime time.Duration TenantUtilizationmap[string]float64}// PriorityQueue 优先级队列(堆)typePriorityQueue[]*Taskfunc(pq PriorityQueue)Len()int{returnlen(pq)}func(pq PriorityQueue)Less(i,jint)bool{// 优先级高的先调度;同优先级下提交时间早的先调度ifpq[i].Priority!=pq[j].Priority{returnpq[i].Priority>pq[j].Priority}returnpq[i].SubmittedAt.Before(pq[j].SubmittedAt)}func(pq PriorityQueue)Swap(i,jint){pq[i],pq[j]=pq[j],pq[i]}func(pq*PriorityQueue)Push(xinterface{}){*pq=append(*pq,x.(*Task))}func(pq*PriorityQueue)Pop()interface{}{old:=*pq n:=len(old)item:=old[n-1]old[n-1]=nil*pq=old[0:n-1]returnitem}// NewScheduler 创建新的多租户调度器funcNewScheduler(config SchedulerConfig)*MultiTenantScheduler{return&MultiTenantScheduler{gpuPool
http://www.jsqmd.com/news/1125628/

相关文章:

  • yolov26改进 | 主干/Backbone篇 | 轻量级移动端网络ShuffleNetv1(附代码+修改教程)
  • 如何快速掌握SysML v2:面向系统工程师的终极MBSE建模指南
  • CubeSandbox 快照、克隆、回滚部署实操体验|OC城市行深圳站
  • OpenCode 实战技巧:从入门到高效开发
  • 开题高效撰写新解法:okbiye 一站式 AI 开题功能化解科研入门难题
  • 我在腾讯云 CVM 上实操 CubeSandbox:从部署到体验快照、克隆和回滚分享
  • 剑星 全内容 中文全DLC 脱离虚拟机 即点即玩
  • 图像和视频处理的核心概念(在图像上画矩形)
  • 好无聊上班的一天
  • 搞懂视图!MySQL 数据表、视图核心差异实战总结
  • 沭阳苗木基地怎么选?老炮儿跑场真心话
  • 4-20mA电流环接收器设计与INA196应用详解
  • 旋转向量,旋转矩阵,四元数,欧拉角之间的转换公式
  • 救命!UniApp上架App Store踩4.3a红线,我靠这招3天逆袭过审了[特殊字符]
  • 学习嵌入式Day3
  • Postfix 邮件服务器 3 大安全加固策略:SPF/DKIM/DMARC 配置与端口 25/465/587 辨析
  • 毕设 深度学习照片上色与动态化
  • 实战指南:如何用开源工具永久保存你的QQ空间数字记忆
  • 从粉丝项目到技术实践:构建自动化内容管理流水线
  • Linux top/ps 命令实战:5分钟定位CPU 100%与内存泄漏的进程
  • C++ STL 容器底层实现与迭代器失效规则总结
  • 告别Codex“裸奔”:10个必装Skills解锁AI编程助手真实力
  • 基于大数据爬虫+Hadoop用户偏好迁移的电影推荐系统
  • OpenNRE:清华开源的实体关系抽取工具包
  • SRS 4.0 HTTP回调实战:Spring Boot 2.3.7 实现7种事件鉴权与日志记录
  • sklearn 1.4+ PDP/ICE 图实战:3步代码从原理到特征筛选决策
  • 2026年6月好用的CNC加工服务商
  • eclipse ditto 学习笔记
  • AI替代人力是假象?微软派6000人驻场,Ford召回老工程师,人力价值凸显!
  • Fable 5复活引争议!“内心戏”暴露,AI意识大讨论升温!