当前位置：首页 > news >正文

量子自编码器在图像分类中的应用与优化

news 2026/5/14 2:14:51

量子自编码器(QAE)作为量子机器学习领域的重要算法，其核心思想源于经典自编码器的架构，但在量子计算框架下实现了更高效的特征提取能力。与传统自编码器类似，QAE由编码器和解码器两部分组成，通过压缩输入数据到潜在空间后再进行重建，从而学习数据的关键特征。

量子自编码器的量子电路主要由三个关键部分组成：

输入编码模块V(x)：负责将经典图像数据转换为量子态。实验中采用的振幅编码(amplitude encoding)技术，可以将2^n维的经典数据映射到n个量子比特的概率振幅上。对于16×16的图像，需要8个量子比特进行编码（因为log₂(256)=8）。
参数化量子电路U(θ)：这是QAE的核心处理单元，也称为ansatz电路。它由一系列可调参数的量子门组成，通过优化这些参数来实现数据的压缩和特征提取。实验中测试了7种不同的ansatz结构（如图6所示），包括实振幅电路(Circuit 1-3)和基于先前研究的结构(Circuit 4-7)。
交换测试(swap test)模块：用于比较两个量子态的相似度，是训练过程中的关键组件。通过测量辅助量子比特的状态，可以判断B系统(垃圾态)和B'系统(参考态)的匹配程度。

QAE的完整工作流程可以分为训练和预测两个阶段：

训练阶段：

预测阶段：

关键提示：在NISQ(含噪声中等规模量子)时代，选择COBYLA这类不需要梯度信息的优化算法尤为重要，因为量子硬件噪声会使基于梯度的优化变得不稳定。

传统QAE主要用于数据压缩和重建，而本研究对其进行了关键改进以实现图像分类功能。核心创新点在于：

分类任务的完整量子电路如图3所示，主要包含以下组件：

图像编码层V(x)：采用振幅编码将16×16灰度图像转换为8量子比特系统的状态。每个像素的灰度值对应概率振幅。
ansatz电路U(θ)：实验中测试了7种不同结构，包括：
- 实振幅电路(图6a-c)：使用RY门进行旋转和CNOT门建立纠缠
- 全连接纠缠电路(图6d)：对所有量子比特对应用受控RY门
- 分层控制电路(图6e)：交替进行RX旋转和受控操作
- 分类专用电路(图6f-g)：强化纠缠以增强特征区分度
标签编码层VL(y)：如图4所示，通过RX门将类别信息编码到参考态。例如，类别5对应量子态|101⟩，通过在第一位和第三位应用RX(π)门实现。
交换测试模块：用于训练期间评估B和B'系统的匹配程度，包含Hadamard门和受控交换门。

实验中的关键参数选择基于以下考量：

量子比特分配：
- 总量子比特数：n + l + 1 = 8 + 3 + 1 = 12
- 其中8个用于图像编码(A+B系统)，3个用于参考态(B'系统)，1个辅助比特用于交换测试
训练设置：
- 优化算法：COBYLA(线性近似约束优化)
- 训练周期：5000次迭代
- 批次大小：全批量训练(考虑到当前量子模拟器的限制)
数据准备：
- 数据集：MNIST、Fashion-MNIST、Kuzushiji-MNIST的子集(4类)
- 图像尺寸：16×16(原始28×28下采样)
- 训练集/测试集：各500张图像，类别平衡

实验系统比较了7种ansatz结构在图像分类任务上的表现。关键发现包括：

实振幅电路表现：
- 电路3(圆形纠缠模式)在MNIST上达到最高准确率82.3%
- 比线性模式(电路2)高4.7%，比反向线性模式(电路1)高6.2%
- 表明循环纠缠有助于提升特征提取能力
复杂结构对比：
- 电路5(分层控制)在Fashion-MNIST上表现最佳(76.8%)
- 但需要更多量子门(每层48个)和参数(每层96个)
- 电路7(交替RX/RZ)在KMNIST上准确率最高(79.5%)
参数效率分析：
- 电路3以相对较少的参数(每层24个)实现了与复杂结构相当的准确率
- 表明并非越复杂的ansatz性能越好，关键在于纠缠模式的设计

表1：不同Ansatz结构在MNIST上的分类性能比较

电路类型	准确率(%)	参数数量	量子门数量
电路1	76.1	24	32
电路2	77.6	24	32
电路3	82.3	24	36
电路4	80.7	64	96
电路5	81.2	96	144
电路6	79.8	48	72
电路7	80.1	32	48

研究将QAE分类器与以下经典方法进行了对比：

非负/二进制矩阵分解(NBMF)：
- 特征维度设置为32(与QAE潜在空间2^5=32一致)
- MNIST准确率78.4%，低于QAE最佳结果(82.3%)
- 参数稀疏度74%，但增加稀疏约束后准确率下降明显
全连接神经网络(FCNN)：
- 相同架构下(输入256维，隐藏层32单元，输出4类)
- MNIST准确率83.1%，略优于QAE
- 但参数量为(256×32 + 32×4) = 8,448，远高于QAE的24-96个参数
量子卷积神经网络(QCNN)：
- 混合架构，仅部分卷积使用量子计算
- MNIST准确率81.9%，与QAE相当
- 但量子部分参数量仍高于纯QAE方法