当前位置: 首页 > news >正文

第42期 字节跳动千人芯片团队:Arm+RISC-V双架构自研CPU全解析

第42期 字节跳动自研CPU芯片深度调研

作者:小Q · 2026-06-28

导读:字节跳动千人芯片团队 Arm+RISC-V双架构自研CPU SeedChip推理芯片 高通定制芯片合作 三星代工 中国互联网最大规模芯片自研尝试

一、巨头的算力焦虑:字节为什么要自研CPU

2026年的字节跳动,已经不是"一家做短视频的公司"。旗下AI产品矩阵——豆包(Doubao)、Coze(扣子)、即创、OmniHuman等——对算力的需求呈指数级增长。Bloomberg在2026年5月的一篇报道中披露,字节跳动正在评估将2026年资本支出最高提升至**$700亿美元**(约合¥4,747亿元),其中用于AI基础设施和数据中心的投入远超预期。

更令人瞩目的是,路透社于2026年5月28日独家报道——字节跳动正在同时开发基于ArmRISC-V两种架构的自研CPU芯片,用于支撑其AI数据中心的通用计算需求。这标志着字节成为继Google、Amazon、微软之后,又一家投入自研服务器CPU的互联网巨头。

核心驱动:x86 CPU价格暴涨 + 交付周期拉长至6个月 → 催生字节的自研CPU战略。英特尔和AMD在2026年一季度均确认CPU市场"供应极度紧张",英特尔甚至卖出了原本已经核销的库存芯片。

二、四大产品线:字节芯片版图全景

字节跳动的芯片业务始于2020年,至今已走过5年多历程。据DoNews 2026年2月报道,字节芯片研发团队规模已超过1,000人,其中AI芯片方向超过500人,CPU团队约200人。目前已形成清晰的四大产品线布局:

产品线代号/方向团队规模进展代工
AI推理芯片SeedChip500+人2026年3月流片,年内量产10万颗三星电子
服务器CPU(Arm)自研Arm CPU200人(含RISC-V)早期开发,评估架构待定
服务器CPU(RISC-V)自研RISC-V CPU同上并行开发,评估中待定
视频处理单元(VPU)视频编解码/审核约100人内部部署中国内代工
数据处理器(DPU)数据中心网络优化约150人研发阶段待定
PICO头显芯片XR专用SoC约50人已量产,延迟12ms国内代工

这一布局的战略逻辑清晰:AI推理(SeedChip)+通用计算(自研CPU)+视频处理(VPU)+网络加速(DPU),覆盖了数据中心从计算到存储到网络的全部关键节点。而其中最具战略野心的一步棋,就是自研服务器CPU。

团队背景:字节芯片业务由副总裁杨震原统管,AI芯片和DPU团队负责人、CPU团队负责人分别向他汇报。CPU团队前负责人卢山(清华大学毕业)已于2023年离职创立蓝芯算力(RISC-V数据中心CPU方向,估值超$1亿美元),但字节并未放弃自研CPU。

三、双架构并行:Arm与RISC-V两条腿走路

字节跳动自研CPU的核心策略是双架构并行——同时开发Arm和RISC-V版本,这是科技巨头常见的风险对冲做法。通过并行开发,字节可以先测试不同选项,再决定是否投入成本高昂的大规模制造。

Arm路线:成熟生态,快速落地

Arm架构在服务器领域已经过十年的生态积累。AWS Graviton(2018年发布)已迭代至第四代,广泛部署在EC2实例中。Ampere Computing的Altra/Maxon系列也已进入Oracle等云厂商。字节选择Arm路线的好处是:软件生态成熟(Linux发行版、编译器、数据库都已原生支持Arm),可以快速部署到现有业务中。

Arm公司CEO Rene Haas在2026年6月的一次公开场合确认,字节跳动和Oracle都是其数据中心CPU客户。这说明字节已经在实际使用Arm服务器芯片(可能是Ampere或AWS Graviton),同时也在自研Arm定制芯片。

RISC-V路线:开源自主,长期主义

RISC-V是更具战略意义的长线布局。字节对RISC-V的投入不仅体现在自研CPU上——其AI芯片(第三代)的部分边缘侧推理芯片已采用RISC-V架构,与NPU协同工作。招聘信息也明确要求熟悉RISC-V架构,显示技术团队对这一指令集的深度重视。

2025年,中国的睿思芯科发布了中国首款全自研高性能RISC-V服务器芯片"灵羽",字节跳动是其投资方之一。这颗芯片采用5nm制程,主频3.6GHz,可扩展至192核,为字节自研RISC-V CPU提供了重要的生态参照。

维度Arm路线RISC-V路线
生态成熟度⭐⭐⭐⭐⭐ 成熟⭐⭐ 早期
定制自由度⭐⭐⭐ 受限(需Arm授权)⭐⭐⭐⭐⭐ 完全开源
部署时间线1-2年3-5年
软件兼容性高(Linux/DB原生支持)中(持续完善中)
地缘风险中(Arm受美国出口管制)低(开源指令集,不受限)
战略定位短期落地,快速替代x86长期自主,摆脱依赖

关键判断:字节的双架构策略不是"二选一",而是"先Arm落地、后RISC-V接棒"。Arm路线解决2027-2028年的CPU供应焦虑,RISC-V路线瞄准2030年后的全面自主可控。

四、生态雄心:高通定制芯片与三星代工

字节的自研芯片野心不止于自己做设计。2026年6月底,路透社再次爆料——高通正在与字节跳动洽谈提供定制芯片设计服务。这一合作如果达成,意味着字节可能借助高通的芯片设计能力和Arm授权,加速CPU的量产进程。

同时,字节的AI推理芯片SeedChip已经锁定三星电子作为代工方,计划2026年3月获得首批工程样品,年内生产至少10万颗,最终产能爬坡至35万颗。SeedChip专为AI推理优化(而非训练),对标Groq的LPU(语言处理单元)架构,专注低延迟实时推理。

字节也在大规模采购商业芯片。2026年5月的消息显示,字节计划采购数百万颗高通AI芯片,同时与英伟达谈判H200中国特供版的供货。这构成了字节的算力组合策略:商业芯片(NVIDIA/高通)保底 + 自研芯片(SeedChip/CPU)提效

五、格局重塑:字节自研CPU对行业意味着什么

对x86阵营的冲击

英特尔和AMD在2026年面临着前所未有的客户流失风险。字节(700亿美元CapEx)、亚马逊、Google、微软都在投入自研芯片。这对英特尔是双重打击——不仅失去了字节这个潜在的大客户,更关键的是,字节的自研Arm/RISC-V CPU一旦成功,将引发中国互联网行业的"跟随效应"。

对中国芯片生态的提振

字节自研CPU对RISC-V生态的意义尤为重大。作为中国最大的互联网公司之一,字节的"背书"效应将大幅加速RISC-V在中国数据中心的落地。睿思芯科、蓝芯算力等RISC-V创业公司都将从中受益。

对标全球互联网巨头的芯片战略

公司AI训练芯片AI推理芯片服务器CPU自研起始年
GoogleTPU v7TPU v7Axion(Arm)2015
AmazonTrainium 2Inferentia 2Graviton 4(Arm)2018
微软Maia 100Maia 100Cobalt 100(Arm)2023
字节跳动暂无SeedChipArm+RISC-V(开发中)2020
MetaMTIAMTIA暂无2023

从对比可以看出,字节是全球唯一同时开发Arm和RISC-V两条CPU路线的互联网巨头。这既反映了字节的战略野心,也折射出中国科技公司面对芯片出口管制时的务实选择——不把所有鸡蛋放在一个篮子里。

六、风险提示:自研CPU没那么容易

字节跳动的自研CPU之路并非一片坦途:

技术门槛极高:服务器CPU的设计复杂度远超AI芯片。一个高性能服务器核心(如AMD Zen 5、ARM Neoverse N2)需要数百名工程师数年的迭代。字节200人的CPU团队(含RISC-V和Arm两条线)相比AMD/Intel动辄数千人的团队,资源投入仍然有限。

制程受限:中国大陆目前最先进的制程仍是SMIC N+2(约7nm等效),与台积电3nm/2nm有2-3代差距。字节若选择自研CPU流片,可能面临"设计先进但制造落后"的困境。

软件生态鸿沟:RISC-V虽然开源,但服务器的软件生态(数据库、中间件、容器编排等)主要在x86和Arm上成熟。即使CPU设计成功,要让整个软件栈迁移到RISC-V,可能需要3-5年。

人才流失:字节CPU团队负责人卢山离职创业(蓝芯算力),表明自研CPU领域的人才竞争异常激烈。字节需要持续高投入才能维持团队稳定。

七、总结与展望

字节跳动自研CPU是中国互联网行业迄今为止最大规模的芯片自研尝试。千人员团队 + 双架构并行 + 700亿美金CapEx后盾,让字节成为全球AI基础设施竞赛中不可忽视的一极。

关键时间线预测

  • 2026年下半年:SeedChip推理芯片量产,首批10万颗部署于豆包推理集群
  • 2027年:自研Arm服务器CPU流片,小规模内部部署测试
  • 2028年:RISC-V CPU初代样品发布,字节成为全球首批部署RISC-V服务器CPU的科技公司
  • 2030年:自研CPU覆盖字节30%+的服务器需求,x86采购比例降至50%以下

字节跳动的自研CPU之路,不仅是技术选择,更是地缘政治下的生存之道。当x86供应日益紧张、美国出口管制不断加码,“算力自主"已经从"加分项"变成了"必答题”。字节用1000人的芯片团队和700亿美金的投入,给出了自己的答案。

http://www.jsqmd.com/news/1090884/

相关文章:

  • 我用AI帮一个小商家解决了“不招人忙死,招人亏死”的困境
  • 视频修复神器:用Untrunc高效恢复损坏的MP4/MOV文件
  • 2026最新AI Agent面试通关手册!从核心原理到工程落地高频考点全覆盖
  • 【AI应用实战-hermes】Mac下安装hermes完整步骤(二)
  • T1200碳纤维意味着什么?
  • MSPM0 ADC FIFO模式与事件管理:数据缓冲与高效传输实战解析
  • Win 11 安装 Android Studio 遇阻:深入剖析 android-emulator-hypervisor-driver 权限弹窗的根源与静默修复
  • AI产品经理爆火!2026高薪岗位,普通人也能进?深度解析+进阶指南!
  • 烟火杭州:实体店找代运营,别让“套路”寒了心
  • Linux VPS 如何迁移到新服务器?2026 最新 rsync 教程:几乎 1:1 无损迁移网站、Docker 和数据
  • 法律技术中的版权保护合同管理与合规审查
  • 5G 启示录:从改变社会到万物智联
  • 220kV降压变电站电气主系统设计:从负荷分析到设备选型的工程实践
  • 【单片机毕业设计】基于 STM32 的带管理员权限电子密码锁设计,基于单片机的智能密码门禁控制系统开发(012501)
  • 3步让老旧Mac重获新生:OpenCore Legacy Patcher终极升级指南
  • 5步精通缠论自动化分析:通达信ChanlunX插件终极实战指南
  • 【单片机毕业设计】基于 STC89C52 的温湿度智能风扇控制系统设计,基于 51 单片机的温湿度采集与风扇调速系统设计(012701)
  • AI 写小说新手实战指南
  • 如何通过5个步骤高效掌握M3U8视频下载的完整解决方案
  • 看懂大语言模型:AI只会猜词,根本不会真正理解
  • 暗黑3自动化革命:D3KeyHelper释放你的双手,专注战斗策略
  • 掌握AXI-Stream时序:从握手信号到数据流传输
  • OpenCV copyTo()函数:从基础复制到掩膜(Mask)精准操控
  • 利用Surfer精准提取地理边界:从BLN文件生成到实际应用
  • 天辛大师浅谈AI时代的作家培养记,哲学青年的闪转腾挪
  • SearchSploit实战指南:离线漏洞库的安装、高级搜索与渗透测试应用
  • Python Playwright自动化测试:从基础输入框操作到高级实战技巧
  • 暗黑破坏神II存档编辑:从菜鸟到高手的5个实用技巧
  • 深入浅出TypeScript泛型编程
  • 专业干货!AI写专著工具推荐,轻松打造20万字出版级专著!