当前位置: 首页 > news >正文

LSTM计算过程

一、网络与参数总览

1. 网络规模(极简版)

  • 输入维度:1
  • 隐藏状态维度:1
  • 时间步:T=2
  • 激活函数:sigmoid (σ)、tanh
  • 初始状态:h₀=0,c₀=0

2. 固定参数(来自 Excel)

表格

门 / 模块输入权重 w循环权重 u偏置 b
遗忘门 f0.50.80.1
输入门 i0.60.70.2
候选细胞 g0.40.90
输出门 o0.30.50.1

3. LSTM 核心公式

  1. 遗忘门:zf​=wf​⋅xt​+uf​⋅ht−1​+bf​;ft​=σ(zf​)
  2. 输入门:zi​=wi​⋅xt​+ui​⋅ht−1​+bi​;it​=σ(zi​)
  3. 候选细胞:zg​=wc​⋅xt​+uc​⋅ht−1​+bc​;gt​=tanh(zg​)
  4. 细胞状态:ct​=ft​⋅ct−1​+it​⋅gt​
  5. 输出门:zo​=wo​⋅xt​+uo​⋅ht−1​+bo​;ot​=σ(zo​)
  6. 隐藏状态:ht​=ot​⋅tanh(ct​)

二、正向传播逐步计算

(1)时间步 t=1,输入 x₁=0.2

  1. 遗忘门计算zf​=0.5×0.2+0.8×0+0.1=0.1+0+0.1=0.2ft​=σ(0.2)=0.549834(与 Excel 一致)

  2. 输入门计算zi​=0.6×0.2+0.7×0+0.2=0.12+0+0.2=0.32it​=σ(0.32)=0.579324(与 Excel 一致)

  3. 候选细胞计算zg​=0.4×0.2+0.9×0+0=0.08gt​=tanh(0.08)=0.079830(与 Excel 一致)

  4. 细胞状态更新c1​=0.549834×0+0.579324×0.079830=0.046247(与 Excel 一致)

  5. 输出门计算zo​=0.3×0.2+0.5×0+0.1=0.06+0+0.1=0.16ot​=σ(0.16)=0.539915(与 Excel 一致)

  6. 隐藏状态输出h1​=0.539915×tanh(0.046247)=0.539915×0.046216=0.024952(与 Excel 一致)


(2)时间步 t=2,输入 x₂=0.5

  1. 遗忘门计算zf​=0.5×0.5+0.8×0.024952+0.1=0.25+0.019962+0.1=0.369962ft​=σ(0.369962)=0.591450(与 Excel 一致)

  2. 输入门计算zi​=0.6×0.5+0.7×0.024952+0.2=0.3+0.017466+0.2=0.517466it​=σ(0.517466)=0.626555(与 Excel 一致)

  3. 候选细胞计算zg​=0.4×0.5+0.9×0.024952+0=0.2+0.022457=0.222457gt​=tanh(0.222457)=0.218858(与 Excel 一致)

  4. 细胞状态更新c2​=0.591450×0.046247+0.626555×0.218858=0.02734+0.13714=0.164480(与 Excel 一致)

  5. 输出门计算zo​=0.3×0.5+0.5×0.024952+0.1=0.15+0.012476+0.1=0.262476ot​=σ(0.262476)=0.565245(与 Excel 一致)

  6. 隐藏状态输出h2​=0.565245×tanh(0.164480)=0.565245×0.16306=0.092142

http://www.jsqmd.com/news/712724/

相关文章:

  • 2026年法奇奥售后保障完善吗,苏州智能制造服务费用多少 - 工业推荐榜
  • baidupankey技术实现深度剖析:从资源获取瓶颈到自动化解决方案
  • 收藏 | AI赋能开发全流程:小白也能掌握的大模型应用秘籍
  • Copilot Next 工作流配置全解析,从零搭建→调试→面试应答一站式闭环方案
  • 算法训练营第十五天|344. 反转字符串
  • [Android] 一个靠AI完成基本的构架 app 家物管(永久免费) 正式版
  • Code Claw:用手机遥控VSCode,实现移动AI编程
  • 2026年苏州热门的反力臂制造商推荐,法奇奥智能科技靠谱吗 - 工业推荐榜
  • 2026年|同一篇论文AI率从0升至91%?AI查重有统一标准吗?高效降AI方法必收藏 - 降AI实验室
  • 智慧农业马铃薯叶子土豆叶子病害检测数据集VOC+YOLO格式3004张7类别
  • MCP 2026多模态模型部署:7步完成从HuggingFace多模态Checkpoint到边缘端TensorRT-LLM服务化上线
  • DiffSeg30k:局部AIGC检测与扩散模型编辑基准解析
  • 盘点2026年郑州二手笔记本租赁服务,好用的推荐 - 工业推荐榜
  • 智能音箱遇到的问题(一)
  • Dell G15散热控制终极指南:告别臃肿软件,3步实现精准温度管理
  • 智慧学生管理系统怎么选?学校管理效率轻松翻倍!
  • 5种方法实现Amlogic电视盒子Armbian刷机:从Android到Linux服务器的终极指南
  • 高速驱动AI提效 金士顿固态硬盘破解存储瓶颈
  • 2026年AI大模型API聚合平台排名揭晓!这五家平台脱颖而出,助你开启AI开发新征程
  • AI Agent对话智能分析:从语义理解到自动化报告生成实战
  • 告别手动录入!MinerU智能文档理解服务保姆级使用指南
  • CWM模型与执行跟踪技术在代码调试中的应用
  • 口碑好的AI企业应用平台供应商
  • 2026年宁波工作服制造厂售后排名,哪家售后好性价比高? - 工业推荐榜
  • 多模态模型部署卡点全突破,深度解析MCP 2026标准下ViT-CLIP-LLM联合推理的内存墙、序列依赖与异构调度难题
  • 总结2026年口碑好的浴室柜定制厂家,雅浪卫浴排名情况 - myqiye
  • 基于MCP协议集成火山引擎AI图像生成到开发工具
  • LLM驱动的UI状态自动化评估技术与实践
  • ChatGPT赋能白帽子:AI辅助网络安全攻防实战指南
  • Phi-4-mini-reasoning效果展示:中文数学题→符号计算→自然语言结论全流程