当前位置: 首页 > news >正文

探究nn.Linear和nn.Conv2d的基本用法

1问题

1.如何在pytorch中使用nn.Linear?

2.如何在pytorch环境中运用nn.Conv2d?

2 方法

1.首先在网上查询了关于nn.Linear的含义。PyTorch的nn.Linear()是用于设置网络中的全连接层的,需要注意在二维图像处理的任务中,全连接层的输入与输出一般都设置为二维张量,形状通常为[batch_size, size],不同于卷积层要求输入输出是四维张量。其中in_features指的是输入的二维张量的大小,即输入的[batch_size, size]中的size。out_features指的是输出的二维张量的大小,即输出的二维张量的形状为[batch_size,output_size],当然,它也代表了该全连接层的神经元个数。
从输入输出的张量的shape角度来理解,相当于一个输入为[batch_size, in_features]的张量变换成了[batch_size, out_features]的输出张量。

  1. Conv2d是用来实现2d卷积操作的,其中:

in_channels 表示输入的channels数

out_channels 表示输出的channels数,

kernel_size 表示卷积核的尺寸,可以是方形卷积核、也可以不是,下边example可以看到

stride 表示 步长,用来控制卷积核移动间隔

padding 表示输入边沿扩边操作

import torch
from torch import nn
conv1 = nn.Conv2d(
in_channels=3, #输入通道数
#每个卷积核的通道数与输入通道数相同
#卷积运算后得到128张特征图
out_channels=128, #输出通道数,表示当前卷积层有128个卷积核
kernel_size=3, #卷积核大小3x3
stride=1, #步长,每次滑动窗口移动的长度,默认为1
)
fc1 = nn.Linear(
in_features=128*26*26, #前一层拉伸后的向量大小
out_features=10,
)
x = torch.rand(size=(32,3,28,28))
x = conv1(x)
x = torch.flatten(x,1) #二维的特征图与全连接进行连接时需要拉伸
x = fc1(x)
#[32,3,28,28] -> [32,32,26,26]
print(x.shape)

输出:

3结语

针对探究nn.Linear问题,其用于设置网络中的全连接层的,需要注意在二维图像处理的任务中,全连接层的输入与输出一般都设置为二维张量,其中参数in_features指的是输入的二维张量的大小,即输入的[batch_size, size]中的size。out_features指的是输出的二维张量的大小。

针对nn.Conv2d问题,其用法是用来实现2d卷积操作的,其中包含了许多用于卷积的参数,in_channels、out_channels和kernel_size是需要手动提供的,而其他的参数是有默认值。

http://www.jsqmd.com/news/102770/

相关文章:

  • EmotiVoice能否实现语音情感渐变过渡?动态控制探索
  • 12月21日,杭州见!
  • 思考与练习(第四章 程序组成与输入输出)
  • Spring AI 最新实战系列(一)完成一个简单的AI项目
  • 思考与练习之答案与解析(第四章 程序组成与输入输出)
  • 终极Kafka-UI快速部署指南:5分钟搞定可视化监控
  • 人机关系中的不可公度性
  • 思考与练习之答案与解析(第三章 Python 编程风格与语法基础)
  • 第一部分:类和对象(中)— 取地址运算符重载
  • NVIDIA没想到会间接干掉中国中低端手机,AI横扫一切!
  • Canva可画中国视觉表达洞察发现,创作者正习惯用情绪表达内容 | 美通社头条
  • C++ 类与对象实战:手把手教你实现一个实用的日期类
  • 【开题答辩全过程】以 基于Android的儿童托管系统为例,包含答辩的问题和答案
  • C++ MFC Qt《高级程序设计实践》任务书(10题)[2025-12-16]
  • 2025年江苏新沂PC砖公司口碑榜单 - 2025年品牌推荐榜
  • Mem Reduct内存管理终极指南:解决电脑卡顿的完整教程
  • 【开题答辩全过程】以 基于JSP的校园停车收费系统设计及实现为例,包含答辩的问题和答案
  • 电脑c盘内存满了怎么清理内存 释放空间不求人
  • 安全开发者峰会:2025年LLM与安全代码报告(附下载)
  • AI视频生成技术原理与行业应用(附下载)
  • 政务智能体发展研究报告(附下载)
  • Inter字体:现代数字排版的终极技术革命
  • Speechless终极指南:一键永久保存微博内容的完整解决方案
  • UniExtract2万能文件解压工具:从入门到精通的全方位指南
  • Open-Meteo终极指南:5步搭建个人天气数据服务
  • 暗黑破坏神2存档编辑器终极指南:从零基础到精通进阶
  • 深度优化:Mem Reduct内存管理工具的高级配置指南
  • 二叉搜索树与双向链表
  • LobeChat安全性评估:数据隐私保护如何做到位?
  • 银行回单识别技术:企业财务智能化的重要基石