2026年ASIC芯片爆发:云厂商与AI实验室发力,重塑半导体产业链!
2026年ASIC芯片领域重磅事件不断:从边缘走向中心,云厂商与AI实验室重塑产业链
2026年第二季度,ASIC芯片领域消息密度空前。6月18日亚马逊确认洽谈将Trainium芯片向外部数据中心出售,6月24日OpenAI与博通联合发布首款自研推理芯片Jalapeño,一周内两大重磅事件接踵而至。此前,谷歌5月携手黑石集团成立50亿美元合资公司将TPU商业化,微软的Maia 200正在与Anthropic洽谈算力租赁,Meta则因收购Rivos后的内部整合失败而陷入被动。这些事件表明,ASIC正在从AI算力体系的边缘走向中心。
超级云计算厂商和前沿AI实验室同时发力,背后不仅是成本控制的商业本能,更是对下一代AI基础设施控制权的争夺。高盛预测,AI驱动的ASIC需求将在2027年与GPU需求平分秋色;2026年四大云厂商的AI资本支出合计预计达7000亿至7750亿美元,同比增长近78%,如此庞大资金体量,任何单一芯片供应商都无法独占。
云厂商:从内部自用到走向台前
长久以来,定制化AI芯片多被视为云计算巨头的 "内部玩具",用于消化庞大的自用算力需求。然而,2026年多项战略异动表明,这层边界正在被打破,核心驱动力是AI工作负载从 "训练主导"全面转向 "推理主导"。SemiAnalysis和Bernstein研究估计,在大规模推理部署中,ASIC相比通用GPU的总拥有成本(TCO)优势达40%至65%;AI图像生成平台Midjourney迁移至谷歌第七代TPU后,月度计算成本从210万美元降至70万美元。这种经济性优势反映在云服务定价上,Artificial Analysis数据显示,基于TPU的谷歌Gemini 3.1 Pro每百万Token混合价格约1.74美元,比同级别的Opus 4.7(4.10美元)和GPT - 5.5(4.35美元)便宜近60%。
亚马逊动作尤为引人注目。6月18日,亚马逊AI业务负责人Peter DeSantis证实,AWS正在洽谈向其他公司的数据中心出售其定制的Trainium芯片。早在4月的致股东信中,亚马逊CEO Andy Jassy就暗示,若芯片业务作为独立实体,将今年生产的芯片卖给AWS和外部公司,年收入将达约500亿美元。目前,亚马逊内部芯片部门年收入运行率已突破200亿美元,其最新的Trainium3芯片发布后迅速 "基本售罄",获超2250亿美元收入承诺。核心客户包括OpenAI、Anthropic和Uber,其中Anthropic承诺部署超100万颗Trainium芯片,签约高达5GW的芯片容量。
谷歌布局更为激进。5月,谷歌宣布与黑石集团成立合资公司 "TPU Cloud",黑石初始承诺出资50亿美元(含杠杆最高可达250亿美元)。该项目目标在2027年上线约500MW容量的AI数据中心,完全基于谷歌提供的TPU硬件、软件和服务构建。这是TPU诞生十年来,首次在Google Cloud体系外大规模商业化销售。谷歌还为纽约州西部的 "Lake Mariner"AI数据中心项目提供32亿美元财务担保,该项目将为Anthropic提供数千个基于TPU的计算节点。供应链层面,谷歌已向英特尔下单生产超300万颗TPU,联发科也切入下一代TPU v10的设计供应链,打破博通长期独占格局。
三大云厂商的自研芯片已形成明确产品定位和客户网络:亚马逊的Trainium/Inferentia系列服务于Anthropic、OpenAI和Uber;谷歌的TPU v7 Ironwood和v8系列吸引了Anthropic、Meta和Midjourney;微软的Maia 200正在争取Anthropic和OpenAI。
微软也在推进。其基于台积电3nm工艺打造的第二代AI加速器Maia 200已在数据中心投入运行,搭载216GB HBM3e内存,FP4峰值性能超10 petaflops。5月,Anthropic正在与微软洽谈租用基于Maia 200的Azure服务器,若达成将成为微软自研芯片的首个重磅外部客户。
OpenAI的九个月造芯
值得注意的是,自研芯片参与者不限于云计算巨头。6月24日,OpenAI联合博通正式发布首款定制推理芯片Jalapeño,标志着全球最大的AI模型公司正式入局芯片赛道。Jalapeño被定义为 "智能处理器",专为大语言模型推理场景设计。OpenAI负责底层架构设计,博通负责硅片实现与网络硬件,Celestica负责板卡与机架系统集成,台积电完成制造。OpenAI总裁Greg Brockman透露,依托公司自研大模型辅助优化,这款芯片从顶层设计到流片仅耗时9个月。早期测试显示,Jalapeño在性能/瓦特指标上显著优于现有方案。
OpenAI的造芯逻辑与云厂商不同。作为全球最大的GPU采购方之一,OpenAI面临的核心问题是算力供给跟不上业务扩张速度。Brockman坦言: "我们对工作负载有深刻理解,一直在寻找那些被现有硬件低效服务的特定任务,思考如何构建专门加速它们的硬件。"博通CEO陈福阳也表示,其六大核心客户的算力需求近乎无限, "算力紧缺不止会持续2026、2027年,预计2028年行业需求还会继续攀升"。
Jalapeño的物理样品已于6月24日交付OpenAI,计划2026年末小规模首批部署,2027年快速爬坡,2028年上半年全面规模化量产,远期规划总耗电量最高将达10GW。这意味着OpenAI正在构建从模型、产品、数据中心到芯片的完整垂直技术栈。
阵痛与壁垒:Meta的教训
然而,自研芯片并非坦途。Meta在这一领域的挫折为行业敲响警钟。2025年9月,Meta斥资超20亿美元收购RISC - V芯片初创公司Rivos,意图加速其自研AI芯片(MTIA)项目。但仅半年后,这场联姻陷入泥潭。据报道,Rivos的整合进程受Meta现有员工与Rivos团队在薪酬和战略路线上严重冲突的阻碍,双方围绕未来芯片应依赖Meta现有IP还是Rivos技术展开政治斗争,导致多个项目延期。更有消息人士透露,Rivos项目在Meta内部已被实质性取消。
这暴露了互联网企业跨界半导体的深层矛盾:软件代码可随时迭代更新,但芯片一旦流片,任何微小架构失误都意味着数亿美元和几个月时间的损失。微软的Maia项目也经历了从2025年推迟到2026年的量产延期。这些案例说明,即便有数百亿美元研发预算,从零构建成熟芯片生态仍需长期持续投入。
与此对比,OpenAI选择更务实路径:不自建芯片团队,而是与博通深度合作,利用后者成熟的硅片实现能力和供应链资源,将自身对模型工作负载的理解转化为芯片架构设计,9个月内完成从设计到流片全过程。这种 "模型公司定义架构+半导体公司实现制造"的分工模式,或许代表更高效的产业协作范式。
产业链重构与市场展望
云计算巨头和AI实验室自研芯片的狂潮,正在重塑半导体产业链的价值分配。博通和Marvell控制全球约95%的定制AI ASIC共同设计市场。博通2026财年第二季度AI半导体收入达108亿美元,同比暴增143%,CEO陈福阳预计2027年AI芯片收入将超1000亿美元。高通凭借低功耗架构积累,成功斩获字节跳动数百万颗AI芯片订单。中国台湾ASIC设计公司世芯电子CEO预测,AI ASIC收入将从2024年的约130亿美元增长至2030年的超1500亿美元,复合年增长率接近50%。
根据TrendForce预测,2026年定制AI芯片出货量将增长44.6%,同期商用GPU出货量增速为16.1%,这是AI时代开启以来,定制芯片出货增速首次显著超过通用GPU。Bloomberg Intelligence预计定制芯片需求到2033年年均增长27%。高盛全球研究所估计,2026年至2031年间全球AI领域总计需要约7.6万亿美元资本投入。
从半导体产业演进规律看, "通用"与 "专用"分野渐趋清晰。通用GPU凭借CUDA等软件生态,在模型训练和多用途AI开发领域仍将保持统治力。然而,在推理规模呈指数级增长的商业化部署阶段,拥有极致成本优势的定制ASIC正在快速切分市场。TrendForce数据显示,ASIC AI服务器出货量预计将在2026年达到AI服务器总市场的27.8%。
对于前沿模型公司而言, "多芯片策略"成标配。Anthropic目前同时运行在AWS Trainium、Google TPU、Azure GPU以及洽谈中的Microsoft Maia四大硬件平台上;OpenAI则在使用亚马逊Trainium、AMD、Cerebras芯片的同时,开始部署自研的Jalapeño。Bessemer Venture Partners合伙人Adam Fisher表示: "一些新兴云公司无法脱离购买某一家全栈硬件,因为他们担心配额被削减"——但随着算力短缺加剧,越来越多公司正在突破这一束缚。
2026年的非GPU AI芯片集中爆发,只是AI基础设施重构的序幕。当模型公司开始定义芯片架构,当云厂商开始向外销售硅片,半导体产业的传统分工正在被重新书写。
