当前位置：首页 > news >正文

面向AI的光学算力增强：光交换和光计算

news 2026/7/9 10:10:26

随着人工智能大模型参数量突破万亿级，算力的瓶颈已不再仅仅是单芯片的晶体管密度，而是互连带宽（I/O）和能效比（TOPS/W）。硅基光子技术正在重构这一格局，它不仅是数据的“搬运工”，更是未来的“计算者”。

一、光通信的“立交桥”：光交换 (Optical Switching)

在讨论硅基光交换时，我们必须明确其在数据中心架构中的物理位置。它不仅仅是芯片上的互连，更是解决大规模集群扩展性（Scalability）的关键。

目前的硅基光交换器件（如 MEMS 光开关、MZI 阵列开关）主要针对的是 Scale-out（水平扩展） 层面的互连，即 机柜与机柜之间（Rack-to-Rack） 甚至 集群与集群之间 的通信。

CPO (Co-Packaged Optics) 是“匝道”： CPO 技术将光引擎与 GPU/Switch 芯片封装在一起，解决了芯片到外部世界的“最后一厘米”高功耗问题。这相当于从芯片这个“工厂”修了一条直通高速公路的匝道。
光交换机 (Optical Switch) 是“立交桥”： 当数据离开 GPU 节点进入网络后，传统的架构需要经过多层电交换机（Spine-Leaf 架构），每次经过交换机都要进行“光-电-光”转换（O-E-O），带来巨大的延迟和功耗。硅基光交换旨在替代核心层的 电交换机，实现全光路由（O-O-O）。

在光计算领域，没有完美的器件，只有最适合场景的妥协。以下是对三种主流光计算单元的对比。

特性	微环谐振器 (MRR)	MZI 阵列 (酉矩阵)	相变材料 (PCM) 存内计算
核心原理	波长选择性调制。利用光的干涉增强，在特定波长处进行幅度调制。	干涉仪网络。通过改变两臂相位差，实现光能量的重新分配（线性变换）。	材料相变。利用GST等材料晶态/非晶态的折射率差异，非易失地存储权重。
优势	高密度、波分复用 (WDM)。单个波导可并行处理数十个波长的乘法，算力密度极高。	宽带、高鲁棒性。对波长漂移不敏感，数学模型（SVD分解）成熟，制造工艺最成熟。	零静态功耗、存算一体。断电后权重不丢失，无需频繁搬运数据，能效比理论最高。
劣势	热敏感性极高。需要复杂的温控电路（Heater）来锁定谐振波长，增加了控制功耗。	尺寸大。级联规模受限（很难做到64x64以上），难以实现大规模并行计算。	写入速度慢、寿命有限。相变过程慢（纳秒级），且材料循环擦写次数有限制。
适用场景	卷积神经网络 (CNN)，高吞吐量矩阵乘法。	神经网络推理，高保真线性变换。	边缘计算，低功耗推理，权重固定的模型。

短期（3-5年）：MZI 阵列。由于工艺成熟度和对环境的耐受性，MZI 方案在早期商业化中最稳妥。目前曦智科技等头部企业多采用此路线。
中期（5-10年）：MRR (微环)。随着热调控算法和材料（如 SiN 氮化硅，热敏感度低）的进步，MRR 凭借 波分复用 带来的超高算力密度，将成为高性能计算中心的主流选择。
终极形态：混合架构 (Hybrid)。未来极可能出现 "PCM on MRR" 或 "PCM on MZI" 的架构。即利用 PCM 做非易失的权重存储（省去维持电压），利用 MRR 做高速的输入调制，结合两者的优点，实现真正的超低功耗、超高速光计算。

AI 计算的核心是 矩阵乘加运算 (MAC)。为了突破传统瓶颈，三种技术流派各有千秋。

原理： 利用存储单元（如 RRAM、SRAM）的物理特性直接计算。利用 欧姆定律（电压 x 电导 = 电流）做乘法，利用 基尔霍夫定律（电流汇聚）做加法。
优势： 打破内存墙。权重固定在单元内，输入电压即可得结果，能效比极高。
劣势： 模拟计算受噪声影响大，精度通常较低，难以进行大规模浮点训练。RRAM等忆阻器目前良率和集成度、写次数还远不能与SRAM相比，只能用于小规模推理inference场景，无法用于训练。