当前位置: 首页 > news >正文

深度学习周报(6.22~6.28)

目录

摘要

Abstract

1 《Toward Large-Scale Distributed Quantum Long Short-Term Memory with Modular Quantum Computers》

1.1 研究背景

1.2 方法

1.3 创新点

1.4 实验结果及总结

2 总结


摘要

本周主要阅读了《Toward Large-Scale Distributed Quantum Long Short-Term Memory with Modular Quantum Computers》这篇文献,学习了解了分布式的量子神经网络结构、模块化的电路设计和阻尼振子实验等。

Abstract

This week, I mainly read the paper titled"Toward Large-Scale Distributed Quantum Long Short-Term Memory with Modular Quantum Computers", learning about distributed quantum neural network architectures, modular circuit design, and damped oscillator experiments, among other topics.

1 《Toward Large-Scale Distributed Quantum Long Short-Term Memory with Modular Quantum Computers》

1.1 研究背景

这篇论文的背景主要围绕 VQC/QLSTM 很有表达能力,但受限于硬件规模,无法扩展到大规模序列建模任务这个核心问题展开,主要表现为两部分。

一是序列建模的挑战。传统序列模型主要依赖 RNN 与 LSTM,但它们存在长序列依赖难以建模(梯度消失/爆炸)、计算复杂度随序列长度增长等问题,在复杂动力系统(如混沌系统)中表现有限。

二是随着 NISQ 设备发展,量子叠加与纠缠可能提升复杂函数拟合能力,并开始用于分类、生成模型、强化学习等任务,逐渐成为主流方法,但 NISQ 噪声严重,难以扩展到大模型。

1.2 方法

本文提出的核心方法是分布式量子 LSTM(Distributed Quantum LSTM),主要在经典 LSTM 的基础上做了以下几点变动。

首先,将经典 LSTM 的线性层替换为了 VQC,这一部分方法和之前那个卷积的差不多,就是替换的东西不一样,其中 VQC 先将输入进行编码,再进行量子变换,最后测量输出。

其次,是分布式量子架构,这也是最核心的部分。由于单个 VQC 的维度太大,容易导致电路深度爆炸,故论文将输入进行拆分,每一块输入都输入到一个在独立 QPU 上运行的小 VQC,最后再将输出结果进行融合。

对于训练,则采用经典加量子混合训练。

1.3 创新点

根据研究方法,可总结出它的创新点在以下几个方面。

第一,首次提出分布式量子 LSTM 结构;

第二,进行了模块化量子电路设计,由多个小 VQC 模块拼接而成,在降低电路深度的同时可以适配 NISQ;

第三,提出了多 QPU 并行架构。

1.4 实验结果及总结

论文主要做了两个任务。

第一个是阻尼振子,判断模型能不能学习连续的物理动态。发现普通的quantum LSTM 效果和收敛速度不稳定,而分布式 QLSTM 训练稳定、收敛快、同时预测很准。

第二个是NARMA序列,判断模型能不能学习长记忆与非线性复杂系统。发现单个量子 LSTM 表现波动很大,不稳定,而分布式 QLSTM 表现中等但稳定,不容易崩。

2 总结

本周主要看了一篇论文,都得也不算深入,感觉主要收获有两点,一是模块化的量子电路,二是实验部分的两个新实验,感觉后续可以学习一下。另外由于这两周期末周,各种考试所以复现一直耽误,希望下周不要再立flag了。

http://www.jsqmd.com/news/1091107/

相关文章:

  • 性价比高的捆扎绳服务周到的公司
  • JavaEE安全纵深防御:JNDI注入攻防演进与高版本JDK绕过实战
  • AI Agent:从RAG到多智能体
  • Gliding Horse 工具结果压缩体系:如何用“指针”驯服上下文膨胀
  • Win11Debloat终极指南:3步快速清理Windows系统,提升70%性能!
  • Agent后端-记忆RAG和上下文管理怎么做才像样
  • 导师严选!2026年性价比拉满的专业降AIGC软件
  • 实战深度解析:Unitree RL GYM如何实现机器人策略的多仿真环境无缝迁移
  • ada_demo_gprbuild demo.gpr操作流程
  • MiniMax M2.7自我进化机制解析:运行时反馈、研究代理与权重更新三闭环
  • 自进化的 Agent 记忆层 —— PowerMem 简易操作手册
  • I2C目标模式陈旧数据刷新与FIFO中断DMA协同实战
  • iot访问控制:模型公式、风险分析与工程落地
  • 如何高效解决macOS安全限制:SMAPI模组加载器完整配置方案
  • 7种客户知识分享策略,Baklib同源多站发布让效率翻倍
  • 图片太大怎么缩小
  • 第14讲|需求不清晰时,如何让 AI 反向追问
  • 看书---------
  • HTML 的 <button> 元素
  • 2026汤阴中古风家具厂家推荐,挑对源头少花冤枉钱
  • 易语言大漠插件模块实战:精准定位窗口句柄的FindWindow系列命令封装
  • OneDrive完全卸载工具:彻底清理Windows系统性能拖累
  • Qualcomm AiHub
  • 如何用5个步骤彻底优化你的Windows系统:Winhance中文版完全指南
  • Win11Debloat:3分钟让你的Windows 11告别卡顿与隐私困扰
  • 第七周学习笔记
  • 包装印刷交货准时性分析:从沟通效率到色彩还原的技术评估
  • VoiceFixer技术解析与应用指南:深度学习驱动的语音修复系统
  • 从数据获取到应用解析:CYGNSS海洋风场观测全流程指南
  • 2026实习会议总结哪个好,AI精准识别高效整理帮你轻松更省事