当前位置: 首页 > news >正文

深度学习 —— RNN

一、什么是RNN模型

循环神经网络,一般以序列数据为输入,通过网络内部的结构有效捕捉

二、RNN单层网络结构

1.句子中的词全部处理完

2.循环次数达到我们的要求

只有一个神经元:对标代码理解就是一个result。

展开:

RNN的循环机制使模型隐层上一时间产生的结果,能够作为当下时间步输入的一部分(当下时间步的输入除了正常的输入外还包括上一步的隐藏层输出对当下时间步的输出产出影响

RNN模型的作用

处理序列数据,并捕捉数据中的时间依赖关系

广泛应用于NLP领域的各项任务,如文本分类、情感分析、意图识别、机器翻译等。

三、RNN模型的分类

按输入和输出的结构进行分类

① N vs N - RNN (理解为对联)

应用场景 -> 词性标注(POS Tagging):为每个单词标注词性

② N vs 1 - RNN (文本分类 -> 对N个句子 进行分类)

应用场景

  • 情感分析:根据一段文本判断情感倾向。
    • 输入:["I", "love", "programming"]
    • 输出:"Positive"
  • 文本分类:将一段文本分类到某个类别。

③ 1 vs N - RNN (文生成图片、图片生成文字. eg:一句话 生成多张图片)

应用场景

  • 文本生成:根据一个初始词生成一段文本。
    • 输入:"I"
    • 输出:["I", "love", "programming"]
  • 图像描述生成:根据一张图像生成描述文本。
    • 输入:图像特征
    • 输出:["A", "dog", "is", "running"]

④ N vs M - RNN (语义理解、文本摘要。eg: 一篇文章->得出一篇摘要)

它由编码器解码器两部分组成,两者的内部结构都是某类RNN,它也被称为seq2seq架构

应用场景

  • 机器翻译:将一种语言的句子翻译成另一种语言。
    • 输入:["I", "love", "programming"](英文)
    • 输出:["我", "喜欢", "编程"](中文)
  • 文本摘要:将长文本压缩为短文本。
    • 输入:["The", "quick", "brown", "fox", ...]
    • 输出:["Quick", "fox", "story"]

按RNN内部构造(神经元内部)进行分类:

传统 RNN

LSTM

BI-LSTM

GRU

BI-GRU



四、RNN内部结构

图解:

公式:

激活函数tanh的作用:用于帮助调节流经网络的值,tanh函数将值压缩在-1和1之间。

分析:


单层:

OUT(t-1) 是 第1个时间步的输出

RNN的输出可以是y向量和最后一个时刻隐藏层的输出

多层:

output 记录的是 最后一层 在每个时间步的隐藏状态

hidden 记录的是每一层 在 最后一个时间步的隐藏状态

不管 RNN 有多少层,最后时刻

输出层 output 的最后一个值 = 隐藏层 hidden 的最后一个值

五、RNN代码使用

import torch import torch.nn as nn
# 0.设置随机种子 torch.manual_seed(4) # 1.构造RNN层的输入张量 # 1.1 模拟当前时间步的词向量,(batch_size,seq_len,embed_dim) x = torch.randn(1,3,10) # 1.2 上一个时间步的隐藏状态,这里是初始隐藏状态,(num_layers*num_directions,batch_size,hidden_size) h0 = torch.zeros(1,1,8) # 2.创建传统RNN层 rnn = nn.RNN( input_size=10, # 输入维度,也就是词向量维度embed_dim hidden_size=8, # 隐藏层维度 num_layers=1, # RNN层的层数,默认1 batch_first=True, # 输入/输出张量的0轴是否为batch轴,默认为False, 设为True时,输入和输出张量的0轴为batch轴 bidirectional=False # 是否开启双向RNN, 默认False )
output, hn = rnn(x, h0)
http://www.jsqmd.com/news/705851/

相关文章:

  • 2026科技升降平台标杆名录:剪叉自行式升降机/固定式升降机/家用别墅电梯/家用曳引电梯/导轨式升降平台/小型升降平台/选择指南 - 优质品牌商家
  • AgentScope多智能体框架:从架构解析到实战应用
  • ARM RealView Debugger宏关键字实战指南
  • 4月27日成都地区华岐产焊管(Q235B;内径DN15-200mm)现货批发 - 四川盛世钢联营销中心
  • 2026年4月更新:武汉旧房翻新品牌怎么选?美客家定制以透明化服务赢得口碑 - 2026年企业推荐榜
  • 2026室外巡检机器人技术分享:机房巡检机器人、机械室巡检机器人、汇集站巡检机器人、泵房巡检机器人、电力巡检机器人选择指南 - 优质品牌商家
  • 终极EVE舰船配置工具:5步掌握Pyfa离线战术规划
  • DevEco Studio:创建卡片
  • 基于Vision Transformer的垃圾图像分类模型:原理、实现与性能分析
  • 2026年第二季度南宁室内装修团队深度**与推荐 - 2026年企业推荐榜
  • 2025届学术党必备的十大降AI率网站实际效果
  • Rust重构终端复用器:oxideterm的设计与实现
  • 深度学习在NLP领域的7大商业应用与技术实现
  • 数据仓库笔记 第三篇:常用缓慢变化维处理方式介绍
  • 2026Q2天津全案定制 天津全屋定制厂家推荐靠谱口碑资质全。行业标杆 - 品牌智鉴榜
  • 永磁同步电机参数辨识与状态估计:扩展卡尔曼滤波(EKF)在RLS性能不足条件下的深度应用研究
  • 2025年江苏PPA板喷淋塔实力厂家盘点:聚焦新质生产力下的高效净化之选 - 2026年企业推荐榜
  • Ripple:基于复杂自适应系统理论的低成本群体智能模拟引擎
  • 2026年4月湖南云石胶市场深度观察:为何这家本地企业备受青睐? - 2026年企业推荐榜
  • LSTM参数解析:return_sequences与return_states实战指南
  • 2026年q2国内靠谱精酿啤酒招商厂家排行:新手创业加盟,轩博啤酒加盟品牌,轻资产创业项目,实力盘点! - 优质品牌商家
  • 2026届毕业生推荐的五大AI论文网站实测分析
  • 4月27日成都地区包钢产无缝钢管(8163-20#;外径42-630mm)厂家直供 - 四川盛世钢联营销中心
  • Driver Store Explorer完整指南:免费清理Windows驱动垃圾,轻松释放磁盘空间
  • 2026年4月废钢回收行业深度洗牌,为何宁波皓诚再生资源有限公司成为首选合作伙伴? - 2026年企业推荐榜
  • 万兴科技加码AI漫剧,旗下万兴剧厂全球首批集成TGI2及可灵AI原生4K
  • AI增强看板vibe-kanban:SvelteKit与LLM API的工程实践
  • AI上下文管理、上下文机制与强化学习的深度融合:2026工业级实战教程
  • string类方法初学理解
  • 数据仓库笔记 第二篇:PSA 层(持久化暂存区)详解