当前位置：首页 > news >正文

量子机器学习与线性光学在MNIST分类中的应用探索

news 2026/4/23 1:56:58

1. 量子机器学习与线性光学的交叉探索

在量子计算与机器学习的交叉领域，量子机器学习(QML)正经历着从理论构想到实际应用的转变。早期研究主要关注基于量子相位估计等子程序的算法，试图证明其相对于经典方法的可证明加速优势。然而这些方法都需要依赖容错量子计算机，而当前我们仍处于噪声中尺度量子(NISQ)时代。这一现实促使研究者转向更实用的硬件兼容策略，如变分量子算法和量子核方法。

线性光学量子计算(LOQC)为QML提供了独特的实现平台。与传统基于量子比特的体系不同，线性光学系统利用光子的量子态(如路径、偏振、轨道角动量等)作为信息载体，通过线性光学元件(分束器、移相器等)实现量子操作。这种架构具有室温运行、低退相干等优势，特别适合实现特定量子机器学习任务。

MNIST手写数字分类作为机器学习领域的"Hello World"，自然成为验证量子机器学习方法的理想测试平台。这个包含70,000个28×28像素手写数字图像的数据集，既足够复杂以展示算法特性，又足够简单便于进行系统评估。在Perceval Quest挑战赛中，研究者们探索了多种将线性光学量子计算与MNIST分类结合的创新方法。

关键认识：当前量子机器学习研究已从追求"量子优越性"的宏大叙事，转向更务实的硬件适配算法开发。这种转变强调在现有噪声量子设备上实现实用功能，而非等待未来容错量子计算机的到来。

2. 线性光学量子计算基础

2.1 光子量子态与操作

在线性光学量子计算中，信息编码在光子数态(Fock态)中。对于一个具有m个模式、n个光子的系统，输入态可表示为|n₁,n₂,...,nₘ⟩，其中∑nᵢ=n。这些光子通过由分束器和移相器构成的干涉仪网络进行演化。

基本量子门包括：

移相器：单模U(1)变换，ˆPϕ = [e^iϕ]，ϕ∈[0,2π]

分束器：双模U(2)变换，矩阵表示为：

ˆUBS(θ) = [ cos(θ/2) i sin(θ/2) i sin(θ/2) cos(θ/2) ]

任何m模酉变换U∈U(m)都可以分解为一系列分束器和移相器的组合，这被称为Reck或Clements分解。这种通用线性光学处理器能够执行任何线性光学操作。

2.2 永久性计算与采样

光子经过干涉仪后的输出态概率由矩阵永久(permanent)决定：

p(⃗n_out) = |Perm(U_{in→out})|² / (∏nᵢ!∏n_j!)

其中U_{in→out}是从U中根据输入输出光子数构造的子矩阵。计算矩阵永久是#P难问题，这构成了玻色采样(Boson Sampling)量子优势的基础。

Quandela的光子量子处理器采用量子点单光子源、12模可编程干涉仪和超导纳米线单光子探测器(SNSPD)构成。配合Perceval软件框架，可以实现从算法设计到硬件执行的完整流程。

3. MNIST分类的量子光子方法

3.1 光子核方法

光子核方法将经典支持向量机(SVM)的概念扩展到量子领域。核心思想是利用光子干涉仪将数据映射到高维特征空间：

数据预处理：将28×28图像通过PCA降维至14×14，再提取前20个主成分
量子特征映射：构建20模干涉仪，注入5个光子，通过交替的分束器层和移相器层
核矩阵计算：通过重复测量估计量子态内积κ(⃗x_i,⃗x_j)=|⟨ψ_i|ψ_j⟩|²
非线性变换：对核矩阵应用sigmoid或多项式变换
经典SVM分类：使用一对一多分类SVM

实验结果(表1)显示，在600训练样本上，量子核方法达到85%验证准确率，虽不及经典线性核(90%)，但展示了量子方法的潜力。增加光子数可进一步提升性能，表明量子资源与模型能力的关系。

模型类型	核函数	验证准确率
经典SVM	线性	90.0%
经典SVM	Sigmoid	88.3%
量子光子SVM	Sigmoid	85.0%

3.2 酉扩张编码神经网络(UDENN)

UDENN基于酉扩张定理，将n×n数据矩阵A编码到2n×2n酉矩阵中：

U_a = [ A √(I-AA†) √(I-A†A) -A† ]

网络架构特点：

初始分束器层
L个可训练酉模块(本实验L=6)
砖块式(brickwork)邻域特征提取
后选择(post-selection)输出

在14×14 MNIST子集上，UDENN达到46.73%准确率，虽低于经典CNN(52.33%)，但显著优于随机猜测(10%)。训练中的主要挑战是后选择导致的计算开销，每个epoch需1.4小时。

3.3 光子量子神经网络

该方法直接将图像像素值编码到干涉仪参数中：

编码策略：S(x)=λx，其中λ∈R⁷⁸⁴为可学习参数
干涉仪设计：两个可训练通用干涉仪(Clements结构)
分类层：经典线性分类器

在10模干涉仪配置下，模型达到81.31%测试准确率，参数量约21k。虽然不及经典MLP(94.14%)，但证明了光子神经网络的可实现性。性能瓶颈主要来自有限模式数和噪声影响。

4. 创新方法：GLASE架构

GLASE(Gradient-free Light-based Adaptive Surrogate Ensemble)通过引入代理模型解决光子量子神经网络训练难题：

4.1 核心创新

代理辅助训练：用神经网络近似量子层输出，实现端到端反向传播
混合损失函数：
```
L_total = L_CE + λ·L_surrogate
```
周期性更新：定期用量子模拟器输出刷新代理模型

4.2 实现细节

轻量CNN提取256维特征
特征映射到M模干涉仪参数(M=20)
3光子玻色采样模拟
代理模型预测光子数统计

4.3 实验结果

在6,000训练样本上，GLASE表现：

优于同类经典模型(迷你ResNet、MLP)
硬件部署验证：16模3光子配置在Ascella QPU上运行
训练稳定性高，避免了 barren plateau问题

5. 系统评估与经验总结

5.1 基准测试结果

综合13种参赛方法，可归纳为三大类：

特征提取型：干涉仪作为端到端特征提取器(如光子核、UDENN)
特征标注型：干涉仪作为量子标注器增强CNN
微调型：干涉仪用于模型精调(迁移学习、自监督学习)

当前最佳量子光子模型测试准确率约85%，与经典CNN(97%+)仍有差距，但参数量显著减少。

5.2 实用经验与避坑指南

维度灾难缓解：
- PCA降维至20-30维
- 优先考虑二进制分类任务(如3vs5)
- 使用可学习编码(如GLASE的λ参数)

硬件意识设计：

# Perceval中硬件兼容干涉仪定义 from perceval.components import Circuit c = Circuit(m) # m模系统 for i in range(depth): for j in range(0,m-1,2): # 砖块式连接 c.add((j,j+1), BS(theta=np.pi/4)) for j in range(m): c.add(j, PS(phi=trainable_phi[j]))