AMD想赢下Profit Law这场战争,还差几块拼图
AMD想赢下Profit Law这场战争,
还差几块拼图
写在AMD高歌猛进之后,我们必须说的那些话
Revenue × SLA Profit =──────────────────────── Token Cost + Human Cost |
Profit Law的公式并不复杂。但要让这个公式真正跑起来,需要的绝不只是一块好芯片。
最近关于AMD作为Profit Law"天然硬件合伙人"的讨论颇为热烈——MI300X的192GB统一内存、EPYC的高核心密度调度、MI300A的零拷贝架构……这些确实是真实优势,没人否认。
但如果你真正开始动手落地Profit Law,你会撞上四堵墙。而这四堵墙,都不是AMD现在能独立拆掉的。 |
─── PART ONE ───
// 01
AMD的真实短板:不是芯片,是芯片之上的一切
▸短板一:ROCm离CUDA还有一道深渊 Profit Law的弹性路由要跑起来,依赖一个关键前提:多模型、多框架、多硬件的自由调度。 理论上ROCm是"开放生态",兼容PyTorch、vLLM。但实际部署中你会发现——vLLM在ROCm上的优化版本比CUDA滞后1–3个版本;FlashAttention-2的ROCm适配仍有性能缺口;很多企业定制化的推理内核根本没有ROCm版本。 这意味着:当你在设计弹性路由的时候,ROCm硬件节点实际上是一个"残血"选项。Profit Law要求的是"简单任务路由到最高性价比硬件",但如果那个高性价比硬件的软件栈不完整,路由来了也跑不满。 更深的问题:企业级AI开发者有一套根深蒂固的CUDA肌肉记忆——调试工具、profiling工具、社区答案,全都在CUDA生态里。ROCm的迁移成本,AMD现在还严重低估了。 |
▸短板二:Profit Law需要的"软件层",AMD几乎全部缺席 把Profit Law的完整链路拆开看,AMD能覆盖的只有最底层:
NVIDIA并不只是在卖GPU——它在用NIM、NeMo、RAPIDS和日益完善的企业AI平台,把客户从数据到部署全程锁住。 AMD的现状:把最好的硬件做出来了,然后把软件层的空白留给了别人。 |
▸短板三:企业级信任体系尚未建立 Profit Law最敏感的场景——医疗辅助、法律审查、金融合规——对供应商的要求不只是"硬件好",还包括:
NVIDIA在大型金融机构、医疗系统里已经有多年的企业级部署背书。Intel有几十年的数据中心可靠性积累。AMD在这些场景的企业信任积累,坦率说,还比较薄。高风险场景的Profit Law落地,光靠好芯片是不够的。 |
▸短板四:冷启动阶段的"最后一公里"支持体系 Profit Law的6步冷启动路径,从Token审计到弹性路由上线,需要的是:提示词工程师、MLOps工程师、领域专家、数据分析师——这是一套完整的能力拼图。 AMD有没有能力帮客户把这支队伍搭起来?有没有实施合作伙伴网络?有没有经过认证的Profit Law落地方法论?目前看,还没有形成体系。 |
─── PART TWO ───
// 02
弥补路径:三条赛道,三种策略
短板清晰了,接下来谈怎么补。
赛道一 |
深度绑定云平台,借道企业AI软件层 AMD不需要自己从零建软件层——它需要的是和已经有软件层的人深度绑定。 微软Azure是最关键的一张牌。 Azure已经在大规模部署AMD EPYC实例,Azure AI Studio提供完整的LLM编排、监控、评估工具链。如果AMD能推动Azure将MI300X作为Azure AI推理的一级硬件选项,并联合优化ROCm在Azure ML上的性能——这实际上是借微软之手,把Profit Law的软件层一次性补齐。
Google Cloud是第二个支点。 Google Vertex AI有业界最强的MLOps工具链——实验跟踪、特征存储、模型注册表、在线评估。如果AMD的Instinct系列能成为Vertex AI的推理加速选项之一,AMD就等于把自己插入了一套成熟企业AI软件生态。 国内头部云厂商——中国市场的特殊机会。 中国企业在AI合规上有独特约束:数据不出境、使用国产大模型、符合等保要求。AMD的ROCm开放生态在这里有天然优势——它不是CUDA,对中国自研AI生态的适配阻力更低。与国内主流深度学习框架及云端AI平台的深度集成,能让AMD在中国市场快速建立Profit Law落地的软件层支撑。 |
赛道二 |
投资或并购补齐关键软件节点 有些短板,合作解决不了,需要直接拥有。AMD应该重点关注以下几类标的:
|
赛道三 |
构建Profit Law认证生态系统 参考NVIDIA的做法:NVIDIA有DGX-Ready Program、NCP(NVIDIA Certified Systems)、以及数以百计的ISV合作伙伴。这套体系让NVIDIA卖的不只是GPU,而是"你买了NVIDIA,整套生态都来了"。 AMD可以建立「Profit Law Ready」认证体系,包含四层:
这套体系建立起来,AMD就不再只是一家"卖芯片的",而是Profit Law落地的生态入口。 |
─── PART THREE ───
// 03
如何与企业级AI巨头合作——核心原则
▸原则一:从算力互补走向价值叙事共建
AI巨头(微软、谷歌、AWS)都有一个问题:他们的AI服务利润率正在被NVIDIA的硬件溢价和客户的API成本敏感性双向挤压。
Profit Law的核心主张——"让每一个Token都对应真实用户价值"——对这些云巨头是一个极有吸引力的叙事:帮客户把AI账单降低60%,自己的调用量和留存率反而上来了。
AMD的合作切入点不应该是"我的硬件便宜",而应该是"我们一起帮你的客户实现Profit Law,降本增效,你的NPS上去了,我的硬件部署量上去了"。共建价值叙事,而非单纯的硬件采购谈判。 |
▸原则二:用中国市场换全球生态
AMD在中国市场有一个独特的战略窗口——国内头部AI公司都在积极建设非CUDA的推理生态,ROCm在这里的接受度远高于其他市场。背后的驱动力不难理解:供应链自主可控的压力,让"不依赖CUDA"本身就成了一张政治正确的牌。
AMD可以把中国市场作为Profit Law生态建设的试验田:率先与几家已具备千亿参数规模的国产大模型厂商建立联合优化合作,在ROCm上打磨弹性路由、缓存、监控的完整工具链,然后把这些成果反哺到全球ROCm生态中。
中国市场,不只是一个销售市场,更是AMD生态建设的研发合伙人。 |
▸原则三:把"开放"变成战略武器,而非防御性叙事
AMD现在谈ROCm开放,更多是作为"我们不是CUDA"的对比优势。这是防御性叙事。
真正的进攻性叙事应该是:AMD是Profit Law时代"多模型、多硬件弹性调度"的基础设施标准制定者。
- 主导推动一个开放的Profit Law指标标准——如何定义SLA、如何计算Token效率、如何归因Revenue——让这套标准成为行业共识
- 与Hugging Face联合建立ROCm优化模型Hub,所有在Hub上发布的模型都有AMD优化版本
- 赞助并主导开源Profit Law工具链(弹性路由器、语义缓存库、SLA监控库),建立技术社区
当AMD成为开放标准的制定者,CUDA的封闭生态就变成了一个劣势,而非优势。 |
─── PART FOUR ───
// 04
一个不得不说的风险
⚠结构性风险提示 Profit Law的核心优化——反哺训练、本体工程、知识工程——需要大量的、高质量的领域数据。这些数据不在AMD手里,不在任何硬件厂商手里,它在企业客户手里。 AMD能做的,是把存储这些数据、处理这些数据、训练这些数据的基础设施做到极致。但数据飞轮本身,是护城河在企业侧,不在AMD侧。 这意味着:AMD在Profit Law战局中,永远是一个"使能者"角色,而非"拥有者"角色。这没有什么不好——水电成为了最好的基础设施生意。但AMD需要清醒地认识到这个定位,在合作中不去抢夺不属于自己的价值,反而要把"让企业的数据飞轮转得更快"作为自己的核心KPI。 |
给别人造护城河的人,自己也会有护城河——只要造的足够多,足够快。 |
─── CONCLUSION ───
Profit = Revenue × SLA ÷ (Token Cost + Human Cost) ──────────── AMD降低了Token Cost的下限,这是真的。 但让Revenue上去,让SLA有保障,让Human Cost合理—— 这三件事,需要的不只是好芯片。 AMD的下一步,是从"最好的硬件伙伴", 进化成"Profit Law落地生态的组织者"。 芯片战争打完了,生态战争刚刚开始。 |
