当前位置: 首页 > news >正文

LSTM的工作原理

一、循环神经网络

1、RNN顾名思义,是包含循环的网络。RNN环路展开后,实际上是同一网络复制的多个副本,顺序连接进行信息传输 。

2、RNN主要有三个特征:
(1)结合内部状态(A)来处理序列;
(2)展示一个时间序列的时间动态行为;
(3)处理连续的、相关联的任务。
与传统的神经网络相比,RNN的主要区别在于它保持了一种内部状态,输出由当前输入和前一时刻的内部状态共同决定。

3、从循环展开之后的表示来看,RNN的信息只能传递给相邻的后继者。当相关输入与期望输出间隔不太长的时候,常规的RNN可以正常应用。而当这个间隔很长的时候,网络训练就会产生梯度消失或者梯度爆炸的问题,使得RNN的长时记忆失效。

4、因此,常规的RNN很难将距离较远的输入和输出关联起来,这个问题被称为长期依赖问题。

二、长短期记忆网络

(1)LSTM网络就是为了解决长期依赖问题产生的。
(2)与常规RNN相比,LSTM网络用cell取代了内部存储。它将数据维护在这个cell中,被称为cell state。 cell state会决定哪些状态应该被留下来,哪些状态应该被遗忘。
(3)常规RNN中的重复单元只包含单层,例如一个tanh层。

LSTM网络中的重复单元包含四个交互层。它们以特别的方式进行交互。

三、LSTM核心思想


LSTM的关键在于细胞的整个状态(绿色的图表示的是一个cell)和穿过细胞的那条水平线。
细胞状态类似于传送带。直接在整个链上运行,只有一些少量的线性交互。信息在上面流传保持不变会很容易。若只有上面的那条水平线是没办法实现添加或者删除信息的。而是通过一种叫做门(gates)的结构来实现的。门可以实现选择性地让信息通过,主要是通过一个sigmoid的神经层和一个逐点相乘的操作来实现的。

sigmoid层输出(是一个向量)的每隔元素都是一个在0和1之间的实数,表示让对应信息通过的权重(或占比)。比如0表示“不让任何信息通过”,1表示“让所有信息通过”。
LSTM通过三个门:输入门、遗忘门、输出门来实现信息的保护和控制。

1、遗忘门

在LSTM中的第一步是遗忘门决定会从细胞状态中丢弃什么信息。比如在语言模型的例子中,当我们看到新的主语,我们希望忘记旧的主语。

2、输入门

下一步输入门是决定让多少新的信息加入到cell状态中来。比如在语言模型的例子中,就是丢弃旧代词的性别信息并增加新的信息的地方。

3、输出门

最终,我们需要确定输出什么值。这个输出将会基于我们的细胞状态,但是也是一个过滤后的版本。

四、LSTM代码具体实现

http://www.jsqmd.com/news/477257/

相关文章:

  • 2026年创业热潮来袭,专业创业指导定制公司能否成为TOP选择?
  • 闲置天猫超市卡别等过期!这样处理,安全又省心 - 可可收
  • 第三章 第一性原理:从零到一的完整思考方法论
  • 技术:双电脑共享鼠标、键盘解决方案 | USB对拷线、Synergy
  • 电赛信号题备赛日记(1)移植正点原子STM32H750 mini pro的TFTLCD屏幕
  • 行楷 - 汉字行楷手写体字形
  • 文献汇总|AI生成图像检测与溯源相关工作(2026)
  • Win10 WSL安装Centos7 Nginx+PHP+MySQL
  • 柔性温度传感器--折线型结构
  • Tomcat简单实现
  • 关于学生课堂行为识别算法
  • 微软 GraphRAG从构图到检索的核心逻辑与代码实现
  • 2026年黄铜、不锈钢、钛合金光纤接头精密零件CNC加工厂家权威推荐:这三家凭什么脱颖而出? - 余文22
  • Esri 2020 10m全球土地覆盖数据下载(Land Cover Downloader)
  • Visual Studio - 修改主题背景颜色
  • 衬线字体 (serif) 和无衬线字体 (sans-serif)
  • Flutter 三方库 google_play_scraper 鸿蒙适配指南 - 实现高性能应用商店元数据抓取、在 OpenHarmony 上打造竞品分析数据防御线实战
  • 蜂胶经常吃的品牌是选哪个? 2026年高吸收蜂胶TOP十榜单:10款实测优选! - 博客万
  • Visual Studio - 修改字体
  • 2019年年底面试了几家大型互联网公司
  • 人脸识别/戴口罩人脸识别 快速实现部署系统方案(Linux / Android)
  • scottplot5中使用signalXY图,如何更新数据?
  • Visual Studio 设置制表符大小和缩进大小
  • 自动导入 AutoImport:告别手动引入依赖,优化Vue3开发体验
  • 叶酸哪个牌子最好最有效?2026叶酸口碑榜单最新揭晓,黄余堂复配辅酶Q10全方位守护母婴安全更省心 - 博客万
  • 解决学某通中不能粘贴的问题
  • 3/14总结:第三届“东软杯”计算机创新设计大赛——基于多智能体协作的复杂数据库自然语言查询系统
  • 2026 年,企业级 AI Agent 的成熟元年
  • vue2.x中slot插槽的使用
  • 【CSS】CSS所有选择器的用法及示例(完整版)