当前位置：首页 > news >正文

英伟达AI Compute Partnership：从“卖铲人“到“收租人“的算力金融化革命

news 2026/7/5 3:07:37

引言：GPU皇帝的"中央银行"时刻

2026年7月1日，英伟达正式宣布推出AI Compute Partnership Program——以收入分成（Revenue-sharing）和信用支持（Credit-support）双机制为核心的AI基础设施合作新模式。

同一天，Meta被曝计划推出云基础设施业务向外部出售算力，引发半导体板块暴跌6%。截然相反的市场信号两相映照，勾勒出AI算力产业最深层的结构性变革：英伟达正在从"铲子供应商"变成算力世界的"中央银行"。

更直白地说：英伟达不再只满足于把GPU卖给你，它要参与你每一次算力出租的利润分成。

一、新模式全景：英伟达的算力金融化双引擎

1.1 双机制架构

┌──────────────────────────────────────────────────────────┐ │ NVIDIA AI Compute Partnership Program │ │ │ │ ┌─────────────────────────┐ ┌─────────────────────────┐ │ │ │ 收入分成机制 │ │ 信用支持机制 │ │ │ │ Revenue-sharing │ │ Credit-support │ │ │ ├─────────────────────────┤ ├─────────────────────────┤ │ │ │ 英伟达从云服务商营收中 │ │ 英伟达利用自身资产负债 │ │ │ │ 抽取约定比例的分成收入 │ │ 表为新兴云厂商提供财务 │ │ │ │ 分成比例随合同期推进 │ │ 担保和算力信用额度 │ │ │ │ 逐步阶梯递减 │ │ 降低初始CapEx门槛 │ │ │ └─────────────────────────┘ └─────────────────────────┘ │ │ │ │ 核心条款（The Information披露） │ │ ┌──────────────────────────────────────────────────────┐ │ │ │ 若云服务商无法找到足够租户 → 英伟达以约定价格回租 │ │ │ │ 未售出的GPU产能 │ │ │ │ │ │ │ │ 等价于：英伟达用自己的资产负债表为算力需求兜底 │ │ │ └──────────────────────────────────────────────────────┘ │ │ │ │ 底层架构：DSX AI Factory │ │ - 基于NVIDIA DSX数据中心平台 │ │ - 大规模多租户AI工厂设计 │ │ - 原生支持Blackwell系列GPU（GB300） │ └──────────────────────────────────────────────────────────┘

1.2 首批合作伙伴

合作伙伴	地区	部署规模	电力规划
Sharon AI	澳大利亚（纳斯达克上市）	最高40,000块GB300 GPU（远期>55,000）	—
Firmus	印度尼西亚·巴淡岛	最高170,000块英伟达GPU	360 MW可扩展园区

1.3 模式对比：从一次性交易到持续性收益

NVIDIA商业模式三重跃迁 ┌──────────────┬───────────────────┬──────────────────────┐ │ 维度 │ 过去 │ 现在 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 角色 │ 硬件供应商 │ 信用中介 + 财务投资者 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 收入来源 │ 一次性芯片销售 │ 持续性使用量挂钩分成 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 风险承担 │ 不承担下游需求 │ 主动承担算力过剩风险 │ │ │ 风险 │ 换取下游利润分成 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 客户关系 │ 卖完即止 │ 长期深度绑定 │ ├──────────────┼───────────────────┼──────────────────────┤ │ 盈利质量 │ 波动性高 │ 经常性收入占比提升 │ └──────────────┴───────────────────┴──────────────────────┘

二、算力供需的真实图景：过剩还是紧缺？

2.1 市场价格信号

英伟达兜底承诺的时机恰好发生在Meta"算力过剩"恐慌引发硬件股暴跌的同一天。但供需数据给出了截然相反的信号：

GPU租赁市场价格走势（2025年10月 → 2026年3月） H100 一年期租赁: $1.70/小时 ───→ $2.35/小时 (+38%) B200 高端GPU租赁: ───→ 涨幅最高94% 所有GPU按需租赁: ───→ 容量100%售罄 高端千卡算力交付周期: ───→ 12-15个月 GPU云端供应商反馈: 供需比 ≈ 1:10（每10个需求只有1个能被满足） 租赁价格半年涨幅 > 25%

2.2 融资障碍 vs 需求不足

新兴云服务商面临的核心障碍不是"算力没人要"，而是"没钱买"：

算力采购的"鸡生蛋"困境： AI模型团队需要GPU训练模型 ↓ 但GPU太贵，需要云服务商提供算力租赁 ↓ 云服务商需要采购大规模GPU集群 ↓ 但采购需要巨额资本支出（CapEx），银行不愿贷款 ↓ 新兴云服务商信用评级低，融资成本高 ↓ 算力供给无法跟上需求增长 英伟达的解决方案： 用自己的资产负债表为新兴云服务商提供信用增级 → 降低融资门槛 → 加速GPU出货 → 获得持续性分成收益

2.3 Meta卖算力 ≠ 算力过剩

同日Meta被曝计划出售算力，被市场恐慌性解读为"算力过剩"。但细究逻辑：

角度	Meta卖算力	英伟达兜底
市场反应	恐慌性抛售硬件股	被忽视的利多信号
隐含判断	算力供过于求	算力需求确定性极高
深层逻辑	Meta CapEx 1250-1450亿美元/年	英伟达愿用自有资金为需求兜底
真相	Meta需要多元化收入来源	融资瓶颈而非需求瓶颈

英伟达用自己的资产负债表为算力需求兜底——如果它对AI算力前景缺乏信心，绝不会做这件事。

三、DSX AI Factory：多租户算力工厂架构

3.1 架构全景

DSX AI Factory是英伟达为大规模算力共享设计的新一代数据中心架构：

┌────────────────────────────────────────────────────────────┐ │ DSX AI Factory 架构 │ │ │ │ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ │ │ AI租户A │ │ AI租户B │ │ AI租户C │ ... │ │ │ (训练任务) │ │ (推理服务) │ │ (微调任务) │ │ │ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │ │ │ │ │ │ │ ▼ ▼ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 多租户GPU调度层（Multi-Tenant Scheduler） │ │ │ │ - 动态资源分配 - 优先级队列 - 抢占恢复 │ │ │ │ - 租户隔离 - QoS保障 - 计费计量 │ │ │ └──────────────────────┬───────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ GB300 GPU 算力池（可扩展至17万卡） │ │ │ │ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ ┌──────┐ │ │ │ │ │DGX │ │DGX │ │DGX │ │DGX │ │DGX │...│ │ │ │ │SuperPod│SuperPod│SuperPod│SuperPod│SuperPod│ │ │ │ │ └──────┘ └──────┘ └──────┘ └──────┘ └──────┘ │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 存储层（NVMe + 分布式并行文件系统） │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ │ ▼ │ │ ┌──────────────────────────────────────────────────┐ │ │ │ 网络层（NVLink + InfiniBand 800G） │ │ │ └──────────────────────────────────────────────────┘ │ │ │ │ 供电层：360 MW 可扩展 │ │ 冷却：液冷（直接-to-芯片） │ └────────────────────────────────────────────────────────────┘

3.2 多租户GPU调度器实现

以下是DSX AI Factory核心组件的Go实现——支持资源隔离、动态分配和抢占恢复的多租户调度器：

// DSX AI Factory - Multi-Tenant GPU Scheduler// Core scheduling engine for NVIDIA's AI factory architecturepackageschedulerimport("container/heap""context""fmt""sync""time")// GPU资源单元typeGPUUnitstruct{IDstringModelstring// GB200, GB300, H100, etc.MemoryMBint64ComputeCapfloat64// TFLOPSStatusstring// free, allocated, reserved, maintenancePodIDstring// 所属DGX SuperPodNodeIDstring}// 租户定义typeTenantstruct{IDstringNamestringPriorityint// 优先级（0-100，越高越优先）GuaranteedGPUint// 保证GPU数MaxGPUint// 最大GPU数（弹性上限）BurstEnabledbool// 是否允许突发弹性使用ContractLevelstring// premium, standard, basicRevenueSharefloat64// 收入分成比例}// 任务定义typeTaskstruct{IDstringTenantIDstringTypestring// training, inference, finetuneGPUCountintMinGPUintMaxGPUintDuration time.Duration PriorityintSubmittedAt time.Time Deadline time.Time Preemptiblebool// 是否可被抢占Statestring// queued, running, preempted, completed, failed}// 资源分配记录typeAllocationstruct{TaskIDstringGPUIDs[]stringStartTime time.Time EndTime time.Time Costfloat64// 累计费用}// MultiTenantScheduler 多租户GPU调度器typeMultiTenantSchedulerstruct{mu sync.RWMutex gpuPoolmap[string]*GPUUnit tenantsmap[string]*Tenant taskQueue PriorityQueue runningmap[string]*Allocation metrics*SchedulerMetrics// 调度策略参数config SchedulerConfig}typeSchedulerConfigstruct{OvercommitRatiofloat64// 超分比（默认1.2）PreemptionGrace time.Duration// 抢占宽限期MaxQueueDepthintAccountingPeriod time.Duration// 计费周期}typeSchedulerMetricsstruct{TotalGPUHoursfloat64UtilizationRatefloat64PreemptionCountint64AvgQueueWaitTime time.Duration TenantUtilizationmap[string]float64}// PriorityQueue 优先级队列（堆）typePriorityQueue[]*Taskfunc(pq PriorityQueue)Len()int{returnlen(pq)}func(pq PriorityQueue)Less(i,jint)bool{// 优先级高的先调度；同优先级下提交时间早的先调度ifpq[i].Priority!=pq[j].Priority{returnpq[i].Priority>pq[j].Priority}returnpq[i].SubmittedAt.Before(pq[j].SubmittedAt)}func(pq PriorityQueue)Swap(i,jint){pq[i],pq[j]=pq[j],pq[i]}func(pq*PriorityQueue)Push(xinterface{}){*pq=append(*pq,x.(*Task))}func(pq*PriorityQueue)Pop()interface{}{old:=*pq n:=len(old)item:=old[n-1]old[n-1]=nil*pq=old[0:n-1]returnitem}// NewScheduler 创建新的多租户调度器funcNewScheduler(config SchedulerConfig)*MultiTenantScheduler{return&MultiTenantScheduler{gpuPool