从2D到3D NAND:存储技术演进、控制器挑战与未来展望
1. 从平面到立体:一场关于存储密度的极限博弈
十多年前,当道格·黄(Doug Wong)在EE Times的访谈中谈及存储行业的未来时,他描绘的图景在今天看来,许多已成为现实,而另一些则仍在深刻的演进之中。那次对话的核心,直指一个困扰半导体行业数十年的根本矛盾:在物理法则的铜墙铁壁前,我们如何持续为世界提供更便宜、更快、更可靠的记忆体?这不仅仅是东芝一家公司面临的问题,而是整个信息时代的基石所承受的压力。从PC到移动设备的浪潮,将NAND闪存推向了舞台中央,但光刻机镜头下的晶体管尺寸已逼近原子尺度,平面(2D)微缩的“免费午餐”显然快要吃完了。当时业界讨论的焦点——是继续在二维平面上“螺蛳壳里做道场”,还是勇敢地迈向第三维度——如今已有了明确的答案,但其背后的技术权衡、商业逻辑与工程挑战,依然值得每一位硬件工程师、产品经理乃至科技爱好者深思。这不仅是关于“怎么做”的技术手册,更是关于“为什么这么做”的战略推演。
2. 平面NAND的黄昏:微缩瓶颈与控制器竞赛
2.1 光刻微缩的物理与工程之墙
道格·黄在访谈中明确指出,NAND闪存一直是半导体行业光刻技术微缩的先锋。这很好理解:存储芯片的核心价值在于单位面积内能塞进多少比特(bit),密度直接与成本挂钩。通过将制程节点从早期的微米级推进到当时的19nm,乃至后来的1x nm、1y nm,比特成本得以指数级下降。他举了一个生动的例子:最初2MB(16Mb)的芯片售价约20美元,而到2013年,同样的20美元能买到约30GB的容量。计算一下,容量提升了约15000倍,但价格不变,这背后的驱动力主要就是光刻微缩和单元架构(如从SLC到MLC、TLC)的演进。
然而,他话锋一转,点出了微缩放缓的现实。这不仅仅是“工程师不够聪明”的问题,而是多重挑战的叠加:
- 理论物理极限:访谈中提到的“栅极不能无限小”是关键。在浮栅型(Floating Gate)NAND中,信息通过存储在浮栅上的电子数量来表征。当晶体管的物理尺寸小到一定程度,浮栅可能只容纳几十个甚至几个电子。此时,电子数量的随机波动(比如由于隧穿效应或热噪声丢失几个电子)就足以导致数据误判,可靠性急剧下降。这不再是工艺问题,而是量子物理开始“发言”了。
- 制程技术瓶颈:道格提到了极紫外光刻(EUV)。在2013年,EUV被视为延续摩尔定律的救星,但因其光源功率、掩膜版缺陷率等问题,“不断被推迟”。事实上,EUV直到2019年前后才在逻辑芯片制造中实现大规模量产,用于NAND则更晚。在EUV成熟之前,行业依靠多重曝光(Multi-Patterning)等复杂且昂贵的技术来推动微缩,这显著增加了制造成本和工艺难度。
- 耐久力(Endurance)的权衡:这是消费者不易感知但至关重要的参数。每次对NAND单元进行编程(写)或擦除,都会对氧化层造成微小的损伤。随着单元尺寸缩小,这种损伤效应愈发明显。道格提到,当时的2D MLC NAND可承受约3000次编程/擦除循环。如果应用场景对写入次数需求降低(例如,主要用于存储静态内容),那么微缩或许还能继续。但现实是,随着SSD取代硬盘成为系统盘,操作系统和应用的频繁读写对耐久力提出了更高要求。
注意:这里存在一个常见的认知误区。很多人认为工艺越先进(nm数字越小),闪存性能就一定越好。实际上,对于NAND,更先进的工艺主要带来更高的密度和更低的比特成本,但往往伴随着原始误码率(Raw Bit Error Rate, RBER)的升高和耐久力的潜在下降。性能(速度)和可靠性更多地由闪存架构(如全页/半页编程)、接口协议(如NVMe)以及控制器决定。
2.2 被忽视的关键角色:存储控制器
道格·黄抛出了一个至关重要的观点:“最大的问题……是人们是否在他们的处理器上拥有足够强大的[纠错码]引擎来应对最新的NAND?” 这句话点出了存储系统的一个核心矛盾:闪存原厂与控制器设计商之间的“龟兔赛跑”。
- NAND的“不完美”特性:随着微缩,NAND存储单元的物理特性会变化,导致:
- 更高的原始误码率(RBER):读取时出错的比特更多。
- 更严重的读写干扰:对一个单元进行操作,会影响相邻单元的电平。
- 更长的读写延迟:某些操作(如擦除)可能变慢。
- 控制器的救赎:控制器(Controller)或主控(SoC)是闪存与主机系统之间的桥梁。它的核心任务之一,就是通过强大的纠错码(ECC)算法、磨损均衡(Wear Leveling)、坏块管理(Bad Block Management)、读写重试(Read Retry)等一系列固件算法,来“掩盖”NAND的物理缺陷,向上层呈现一个稳定、可靠、快速的逻辑块设备。
- 节奏错配的挑战:道格指出,闪存制造商可以快速推进到新的制程节点,但控制器的设计周期往往更长,且不一定能与NAND新品发布同步。一款新的、更“脆弱”的NAND需要更强的ECC(如从BCH码升级到LDPC码),而开发并验证一套新的LDPC引擎需要时间。如果控制器没准备好,再先进的NAND也无法稳定工作。
实操心得:在选择SSD或eMMC/UFS等存储方案时,不要只看闪存颗粒的制程(例如是19nm还是15nm)。同样重要甚至更重要的是主控芯片的型号和厂商的固件调校能力。一个成熟稳健的主控配稍旧制程的颗粒,其实际体验和可靠性可能远胜于新制程颗粒搭配不成熟的主控。这也是为什么一些高端消费级和企业级SSD会强调其自研主控和固件算法的原因。
3. 破局之路:三维堆叠与下一代存储技术
当平面微缩步履维艰时,行业自然将目光投向了垂直维度。道格·黄在访谈中清晰地指出了东芝当时的两大技术方向:3D NAND和新型非易失性存储器(如ReRAM和MRAM)。
3.1 3D NAND:从“平房”到“摩天大楼”
3D NAND的理念非常直观:既然在XY平面上缩小晶体管越来越难、越来越贵,那就在Z轴上堆叠起来。传统的2D NAND是“平房”,所有存储单元都建在硅基底这一层。3D NAND则是“摩天大楼”,通过沉积、蚀刻等工艺,在垂直方向堆叠数十甚至上百层存储单元。
3D NAND带来的核心优势:
- 摆脱光刻微缩依赖:单元尺寸可以做得相对宽松(例如40nm级别),从而大幅提升耐久力和数据保持力。密度提升主要通过增加堆叠层数来实现,这比推进光刻节点在成本和可行性上更具优势。
- 更高的存储密度:这是最直接的收益。通过堆叠,单位芯片面积上的比特数得以倍增。
- 潜在的性能优化:由于不再追求极限微缩,电荷捕获层(Charge Trap Layer,现代3D NAND多采用CTF结构而非传统浮栅)可以设计得更稳健,有助于改善读写速度。
3D NAND面临的严峻挑战(2013年视角):
- 制造成本:这是访谈中记者尖锐提问的核心。建造“摩天大楼”的工艺(如高深宽比的通道孔蚀刻、多层薄膜的均匀沉积)远比盖“平房”复杂。初期,3D NAND的晶圆成本可能高于最先进的2D NAND。道格·黄的回应体现了半导体行业的商业智慧:消费者只为价值买单,而非技术本身。他的计算表明,历史上比特成本的下降速度甚至快于光刻微缩带来的密度提升速度,这得益于自动化、晶圆尺寸增大(从8寸到12寸)和良率提升。对于3D NAND,目标同样是通过工艺成熟、规模效应和架构优化,使其比特成本最终低于2D NAND的极限。事实证明,他预判正确,如今3D NAND已成为绝对主流。
- 工艺复杂性:如何在上百层结构中精确地刻蚀出贯穿所有层的垂直通道孔?如何保证每一层存储单元的电气特性均匀一致?如何管理堆叠后产生的巨大应力?这些都是需要攻克的核心工程难题。
3.2 下一代非易失性存储技术:ReRAM与MRAM
除了在现有技术上做延伸,道格·黄也展望了可能颠覆格局的新技术。他将ReRAM(阻变存储器)和MRAM(磁阻随机存储器)列为“未来的领跑者”。
- ReRAM:利用材料(如金属氧化物)在不同电阻态之间切换来存储数据。其优势在于结构相对简单,读写速度快,功耗低,且具备良好的微缩潜力。它被视为可能替代NAND用于高密度存储的候选者,也适合用于存算一体等新兴架构。
- MRAM:利用电子自旋的磁矩方向来存储信息。道格特别强调了MRAM的无限耐久性和高速读写特性(接近DRAM速度)。这带来了一个革命性的系统架构想象:消除存储层级。
当前系统架构的瓶颈:在现有计算机架构中,CPU从高速但易失的DRAM中取指令和数据。DRAM的内容在断电后丢失,因此系统启动时,需要从非易失但较慢的NAND或硬盘中将操作系统和程序“加载”(Shadow)到DRAM中。这个过程耗时且增加了系统复杂度。
MRAM带来的范式变革:如果有一种存储器,既能像NAND一样断电不丢失数据(非易失),又能像DRAM一样快速读写且寿命极长,那么DRAM和NAND的界限就可能模糊。道格设想,有了MRAM,或许就不再需要“加载”这一步了——数据始终就在那里,开机即用。这不仅能极大加快系统启动和响应速度,还能简化内存子系统设计,降低整体功耗。
注意:道格也提到了一个关键点:“读耐久性并非无关紧要”。对于MRAM,虽然写操作几乎不磨损,但频繁的读操作可能会对相邻单元产生干扰(读干扰),这需要通过电路设计和纠错来管理。任何新技术在带来优势的同时,都会引入新的挑战。
为什么不是PCM、FeRAM?访谈后的读者评论中,有人问为何未提及相变存储器(PCM)和铁电存储器(FeRAM)。这反映了当时的技术格局。PCM虽然成熟较早(如英特尔傲腾技术基于的3D XPoint本质是PCM变种),但在成本、密度和 scalability 方面面临挑战。FeRAM则受限于材料极化疲劳和微缩难度。道格的回答(以及当时行业研讨会的论文分布)表明,在2013年的时间点上,基于综合评估(密度、速度、耐久力、制程兼容性、成本潜力),3D NAND、ReRAM和MRAM是资源投入和业界看好的主要方向。
4. 从技术蓝图到商业现实:十年后的回望与当前挑战
站在今天回顾2013年的这场对话,我们可以清晰地看到技术路线的演进与市场的选择。
4.1 3D NAND:从概念到统治地位
东芝(现为铠侠)及其合作伙伴西部数据,以及三星、SK海力士、美光等厂商,成功将3D NAND推向了大规模量产。堆叠层数从最初的24层、32层,一路攀升至目前的200层以上,甚至向500层迈进。道格关于“通过3D技术延续密度提升并控制成本”的预测已成现实。3D NAND不仅成为了消费级SSD、手机存储的标配,也彻底占据了企业级存储市场。
当前3D NAND的核心竞赛点:
- 堆叠层数与单元结构:层数竞赛仍在继续,但单纯堆高会面临工艺复杂度、良率和成本的非线性上升。因此,厂商同时致力于单元架构的革新,例如:
- 电荷捕获型(CTF)取代浮栅(FG):已成为主流,因其在3D结构中的可制造性和可靠性更优。
- 串堆叠(String Stacking):将存储单元串在垂直方向上进行多次堆叠,是突破单次工艺堆叠层数限制的关键技术。
- 四层单元(QLC)甚至五层单元(PLC):在每单元存储更多比特(4bit或5bit),进一步提升密度,但以牺牲耐久力和性能为代价,适用于冷数据存储。
- 接口与性能:NAND的接口速度也在飞速提升,从早期的SATA到PCIe Gen3/Gen4/Gen5,配合NVMe协议,使得SSD的峰值带宽从几百MB/s提升到超过10GB/s。控制器技术,尤其是LDPC纠错、独立NAND通道管理和多核处理器,变得空前重要。
4.2 下一代存储:MRAM与CXL的融合
MRAM的发展路径与当初的设想略有不同,但前景依然广阔。目前,基于自旋转移矩(STT-MRAM)的器件已实现量产,主要应用于:
- 嵌入式领域:作为微控制器(MCU)中的非易失性内存,替代eFlash,用于物联网设备、汽车电子等,提供高速、高耐久性的代码存储。
- 缓存/缓冲器:作为SSD或DRAM的缓存,利用其非易失性,在意外断电时保护数据。
而道格所设想的“取代DRAM”的愿景,正通过存储级内存(Storage-Class Memory, SCM)的概念和Compute Express Link (CXL)互联协议逐步实现。英特尔的傲腾持久内存(基于3D XPoint,一种与PCM相关的技术)是早期的SCM尝试。如今,行业正探索将MRAM、ReRAM等与CXL结合,创造出既能按字节寻址(像内存)、又具备非易失性和大容量(像存储)的新型层级,真正打破内存与存储的鸿沟。
4.3 持续存在的挑战与工程师的应对
尽管技术取得了巨大进步,但道格·黄当年提及的一些根本性挑战依然存在,只是形式发生了变化:
- 可靠性管理:对于QLC/PLC NAND,原始误码率更高,对ECC的要求达到了新的高度。先进的LDPC纠错、基于人工智能的读电压校准、更精细的磨损均衡和垃圾回收算法,是控制器固件开发的核心战场。
- 功耗与散热:高性能PCIe Gen5 SSD的功耗可达10瓦以上,散热成为高端产品设计的瓶颈。如何平衡性能、功耗和温度,是系统级设计的关键。
- 安全与数据完整性:从硬件加密引擎到固件信任根(RoT),存储设备的安全性要求日益提高,防止物理攻击和固件篡改。
- 软硬件协同设计:随着CXL等新互联标准的出现,存储不再是一个独立的“黑盒”。如何让主机处理器更高效地管理、访问SCM,需要从操作系统、驱动程序到应用软件的全面优化。
给工程师和开发者的建议:
- 关注存储介质特性:开发数据库、文件系统或任何I/O密集型应用时,需要了解底层存储(是SATA SSD还是NVMe SSD?是TLC还是QLC?)的基本特性,如读写延迟、4K随机性能、顺序带宽等,以便进行针对性优化。
- 理解持久化模型:随着SCM和MRAM等非易失内存的兴起,传统的以块或文件为单位的I/O模型可能会演进。关注如PMDK(持久化内存开发套件)这样的编程模型,为未来的存储层级变革做好准备。
- 系统级视角:存储性能瓶颈往往不在存储设备本身,而在主机接口(PCIe通道数)、总线带宽、驱动程序效率乃至应用程序的I/O模式。进行全链路性能剖析至关重要。
5. 未来展望:超越微缩的存储创新
存储技术的未来,将不再仅仅是关于“如何把单元做得更小或堆得更高”,而是围绕异构集成、智能管理和新计算范式展开。
- 存算一体(In-Memory Computing):这是ReRAM等新型存储器的一大用武之地。利用电阻器件的模拟特性,直接在存储单元内进行矩阵乘加等运算,可以极大地加速人工智能推理等任务,突破“内存墙”限制。这需要存储器件、电路设计和算法模型的深度融合。
- 晶圆级集成与先进封装:通过硅通孔(TSV)、混合键合(Hybrid Bonding)等先进封装技术,将NAND裸片、控制器裸片、甚至DRAM裸片以3D方式集成在一起,可以大幅提升带宽、降低功耗、减小体积。这被称为“3D系统集成”,是超越“3D NAND”的下一步。
- 材料与器件创新:寻找新的电荷捕获材料、探索铁电晶体管(FeFET)等全新器件原理,可能为NAND带来新的生命。而在MRAM方向,基于自旋轨道矩(SOT)或拓扑绝缘体的新结构,有望进一步降低写入电流,提升速度。
- 以数据为中心的架构:随着CXL协议的普及,内存和存储的界限将进一步模糊,形成可动态配置的“内存池”和“存储池”。系统架构将从“以CPU为中心”转向“以数据为中心”,计算资源被动态调度到数据所在的位置,而非相反。
回望2013年道格·黄的分享,其价值在于清晰地勾勒了存储行业在面临物理极限时的战略思考框架:在现有技术上深度优化(如强化ECC控制器),开辟新的维度寻求突破(3D堆叠),并积极探索颠覆性的替代方案(MRAM/ReRAM)。这条路径至今依然指导着存储行业的发展。对于身处其中的工程师而言,理解这些底层技术演进的逻辑,比追逐某个具体的制程数字更为重要。因为决定最终产品竞争力的,从来不是单一指标的领先,而是在密度、性能、可靠性、功耗、成本这个多维魔方上找到的最佳平衡点。存储的故事,远未结束,它正从微观的器件物理,走向宏观的系统架构革命,而这场革命的核心,始终是为了更高效地承载人类不断膨胀的数据与智慧。
