当前位置: 首页 > news >正文

美光 CEO 放了一句狠话:别低估造内存,这玩意比你想的难得多

美光 CEO 放了一句狠话:别低估造内存,这玩意比你想的难得多

重点不是“内存很重要”,而是 AI 改变了存储行业的产能分配。

美光 CEO 桑杰·梅赫罗特拉最近对存储供需给出了一条很明确的判断:紧张会持续到 2026 年以后,而且不只是 HBM。

这不是泛泛地说“AI 需要更多内存”。他的逻辑是,AI 正在同时抬高 DRAM 的容量需求、带宽需求和单位晶圆的资源消耗,而新增供给没法在一两年内补上。

HBM 抢走的,不是一小块高端市场

HBM 是 AI 加速卡使用的高带宽内存。它的价值不只在售价高,更在于它会占用更多制造资源。

  • 高性能 DRAM 的裸片面积更大,单位可销售容量消耗更多晶圆;
  • 多层堆叠、测试和先进封装增加了后段工序;
  • 产品需要经过更长的客户验证,产能不能像消费级内存一样随时切换;
  • 良率要同时过前段晶圆、堆叠、封装和系统测试几道关。

因此,HBM 占比提升的结果不是“多了一条产品线”,而是同样的晶圆投入,能变成的可销售 bit 变少了。

这也是为什么市场会同时看到 HBM 紧、服务器 DRAM 紧,甚至 DDR4 也开始紧。DDR4 不直接受益于 AI,但供给端正在主动退出成熟产品,把资源转向更高增长、更高利润的产品;只要旧平台的需求退得没那么快,交期和价格就会重新承压。

真正的瓶颈是量产,不是设计一颗芯片

桑杰反复强调,存储制造不能被低估。

一颗逻辑芯片出了问题,可能影响一个模块;存储芯片里却有数以万亿计的 bit。它们要在性能、功耗、可靠性和可测试性之间同时达标,还要把良率爬到能够大规模交付的水平。

今天的难度还在增加:行业不再只靠制程缩小来取得明显的 bit 增长,同时还要面对更高带宽、更低功耗和更复杂封装。

所以存储的护城河并不只是 IP 或设备采购能力,而是长期积累的工艺、材料、良率和规模化运营能力。DRAM 市场最终只剩少数大型供应商,并不是偶然。

为什么扩产解决不了眼前问题

一座新存储晶圆厂,从破土到稳定出片通常要三到四年,之后仍要经历设备安装、工艺导入和良率爬坡。

但 AI 的需求变化按季度发生。

模型参数增加、上下文窗口变长、推理并发上升,都会推高内存占用。尤其是推理侧,KV Cache 会随着对话长度和并发请求持续占用资源。模型能否服务更多用户,不只取决于 GPU 数量,也取决于内存能否装下并持续读取这些上下文。

这就形成了典型错配:供给按“年”扩张,需求按“季度”变化。

2000 亿美元,投的是下一轮有效产能

美光的美国投资计划规模达到 2000 亿美元,马纳萨斯扩建、爱达荷和纽约项目是其中的关键节点。

这笔钱的重点不是立刻多卖多少内存,而是提前锁定厂房、基础设施和未来设备安装空间。设备投入仍会跟着需求预测和技术进展调整,这也是美光所说的“有纪律的投资”。

对服务器、云厂商和 AI 基础设施公司来说,需要盯住的不是单一内存价格,而是三件事:

  1. HBM 扩张是否继续挤压通用 DRAM 的有效供给;
  2. 服务器内存的交期和 BOM 成本是否开始影响整机交付;
  3. GPU、HBM、DRAM 和先进封装能否一起交付,而不是某一项单独到货。

桑杰的判断可以概括成一句话:AI 的需求不是一次性买卡,而是持续消耗存储容量、带宽和晶圆产能。

存储周期当然不会消失,供过于求仍可能发生。但 AI 已经改变了存储在系统中的位置:它不再是算力扩张的配角,而是决定 AI 集群能不能继续扩张的硬约束。

http://www.jsqmd.com/news/1074761/

相关文章:

  • 30分钟构建与部署OpenEMS:从零搭建开源能源管理系统
  • 数之和:从“暴力相亲”到“提前登记”——算法里的时间-空间交易哲学(哈希表)
  • 长肥网络下的单流拥塞控制对比:BBR vs KCC
  • Redis容器重启循环问题排查与数据持久化完整指南
  • Anthropic新架构层蒸发:LLM封装层为何正在归零
  • 完整指南:如何用DroneSecurity工具快速解密DJI无人机通信数据
  • AI动态简报之技术前沿篇(2026.06.24)
  • 《笨蛋美人她天生凤命》小说|下载|txt
  • 从规则引擎到大模型:NLP范式迁移与提示即架构实践
  • 人机协作新范式:2026年不容错过的专业AI论文软件
  • 化学机器学习实战:从分子特征到可部署API的七步炼金术
  • qBittorrent搜索插件终极指南:一键解锁20+种子网站资源
  • OpenCore Legacy Patcher技术深度解析:老Mac兼容性突破与性能优化终极方案
  • 3步完成Rhino到Blender的无缝转换:import_3dm插件完全指南
  • 基于Qwen3-14B与OpenClaw的AI驱动接口自动化测试实践
  • 毕业论文存在哪里安全不易丢失?2026超稳存储平台实测分享
  • 跨国出差网络自动切换方案的工程实践
  • 印度AI工程实战:多模态取舍、KAN应用与LLM生产部署
  • AI工程实战:三阶段视频生成、JAX高性能优化与LLM落地失败避坑指南
  • 同一 WiFi 下 SSH 连不上:Ping 通但 22 端口超时的排查实录
  • 如何彻底移除Microsoft Edge:EdgeRemover工具完整指南
  • TD学习实战指南:从原理到工业级部署的12条铁律
  • HarmonyOS NEXT和Android到底有什么区别?看完这篇你就懂了
  • phone2qq:基于TEA加密协议的手机号与QQ号关联查询引擎
  • TRIBE v2:零样本多模态脑响应预测模型实操指南
  • 如何快速上手Windows 12网页版:面向新手的终极在线体验指南
  • AI编排实战:MuleSoft+LangChain双引擎构建企业级销售智能助手
  • 防火墙安全策略方向配置:从AI问答看网络工程实践
  • SRv6 SFC:下一代智能网络的核心技术
  • 2025十大AI生活突破:零代码、低延迟、低成本的日常落地实践