当前位置: 首页 > news >正文

卷积神经网络(CNN)简介-卷积神经网络介绍

全连接神经网络瓶颈

Alt

全连接网络特点:每个隐层都与前层所有的神经元相连。

全连接层缺点:

1.当图像越大,隐层神经元越多,权值和偏置越多,模型会非常复杂导致过拟合;

2.对于三维度的图像信息全排列成一列的信息,忽略了图像数据的形状特征。

因此,全连接神经网络的输入适合小图像或者已经用特征向量表示的图像。而卷积神经网络是学习多个卷积核组计算出图像的特征向量,作为上面全连接神经网络的输入。卷积层也可保持形状不变,当输入数据是图像时,卷积层会以3 维数据的形式接收输入数据,并同样以3 维数据的形式输出至下一层

CNN网络特点

卷积神经网络(Convolutional Neural Network,CNN)。CNN被用于图像识别、语音识别等各种场合,在图像识别的比赛中,基于深度学习的方法几乎都以CNN为基础。主要分为:卷积层、激活层、池化层、全连接层。

Alt

CNN 中新增了Convolution 层和Pooling 层。CNN 的层的连接顺序是“Convolution - ReLU -(Pooling)”(Pooling 层有时会被省略)。这可以理解为之前的“Affine - ReLU”连接被替换成了“Convolution -ReLU -(Pooling)”连接

Alt

Convolution 层的作用:与纹理表示中卷积核组相同最终目标是得到特征响应,作为FC层的输入。

Pooling 层的作用:减少数据计算量、增大视图感受野

卷积层

卷积核

Alt

一个卷积核的计算

在这里插入图片描述在这里插入图片描述

计算过程中,于一个像素而言,卷积核与原图覆盖对应的像素位置进行卷积计算(相当于点乘求和)得到一个数再加上偏置b得到该像素的特征响应值,因此整图计算完得到一个二维的特征响应图。

多个卷积核计算情况:

在这里插入图片描述

理解:

1.当卷积核组有6个卷积核时,对应得到的特征响应图深度为6,分别描述了6个不同基元卷积核的特征响应;

2.每个位置的响应值,若对应特征响应值大那么该位置对应于原图上的特征显著。

3.当设计网络时,需要设定特征响应图的W、H和前层卷积核的个数(决定响应图的深度)。卷积核的大小通常设定为3_3、5_5、…、最大到11*11

卷积步长(stride)

卷积神经网络中,卷积核 可以按照指定的间隔进行卷积操,这个间隔就是 卷积步长

特征图尺寸和图尺寸、卷积核尺寸、卷积步长的关系如下图:

在这里插入图片描述

边界填充

CNN中常用的填充方式是零值填充,与卷积核尺寸、卷积步长、零填充数量关系如下图:

在这里插入图片描述

图中公式可以计算:

1.假设设定了W1、F、P,可以得到输出W2的大小;2.假设知道W1、W2、F可以计算填充大小

特征响应图尺寸计算总结:

在这里插入图片描述

注意:设计网络时不需要考虑特征图的深度,因为它是由前层卷积核个数决定的

池化操作(pool)

在这里插入图片描述

理解:1.神经网络反向传播时需要用到前向网络的计算结果,正向计算结果通常要预存在显存中,因此通常需要降低数据量,减少显存的需求量。2.降数据量,可以通过池化操作减小特征图大小。3.当特征图缩小了,同样大小的卷积核相当于能覆盖更大的视野(相当于对原特征响应图用了更大方差的卷积核),因此池化操作的作用:减小数据量、增大感受野

注意:池化操作是对每个特征响应图进行独立操作,而不是卷积操作计算的总和

最大池化操作例子:

在这里插入图片描述

池化步长、池化窗口、池化方式都是需要自己设置的。最大池化可以理解为cv中边缘提取的非最大化抑制

图像增强

在这里插入图片描述

经典网络

目标分类网络:Alexnet ZFnet VGG GoogleNet ResNet

目标检测与分割网络:FCN、R-CNN、fast R-CNN、faster R-CNN、YOLO全系列、Mask R-CNN

在这里插入图片描述

注:本文搬运自本人20250409的CSDN文章:https://blog.csdn.net/sinat_26398509/article/details/147096514?spm=1001.2014.3001.5502

http://www.jsqmd.com/news/412532/

相关文章:

  • 【RCCL】RCCL工具
  • 大数据交易数据湖架构设计指南
  • 2026年2月25日
  • 什么是动态住宅 IP 代理?动态 IP 最常用在哪些业务
  • 搜索已死,问答永生:2026年6大特色GEO服务商实战图谱与避坑指南 - 品牌2025
  • LLM支持的AI Agent上下文感知推荐技术
  • langchain架构设计以及应用案例分享
  • AI获客新范式:2026年6大优质GEO服务商全景解析与实战指南 - 品牌2025
  • TypeScript学习
  • 工业AI的赛道有哪些主要玩家?全球竞争格局与未来趋势探讨
  • pycharm安装及环境配置
  • 整车制造计划排程排产系统的创新与实践
  • 工业超级智能体在整车制造如何实现生产优化与决策协同?
  • 告别盲目投放:2026年七大GEO服务商深度拆解与精准匹配 - 品牌2025
  • Rust学习笔记第2篇
  • 2026年负债人必看:如何合法高效解决信用卡债务问题? - 代码非世界
  • 网贷协商最佳解决方案,教你找到靠谱的债务协商服务商 - 代码非世界
  • 2026年贷款债务协商全攻略,2026年信用卡贷款债务协商,正确的解决方案到底是什么? - 代码非世界
  • 2026年信用卡/贷款逾期后,如何合法协商分期还款? - 代码非世界
  • 《白色相簿2》《歌を忘れた偶像》终章-雪菜线玩后感
  • docker 入门
  • docker 入门2
  • 深入解析 MobileNetV2:边缘AI场景中最常用的轻量化卷积神经网络
  • Perl 条件语句详解
  • docker 镜像备份
  • 创客匠人:2026知识付费“生死局”,AI智能体如何重构“交付”价值?
  • docker 使用GUI ROS2
  • 创客匠人:从“授人以渔”到“替人捕鱼”,AI智能体正在重写知识服务底层逻辑
  • MNIST 数据集在边缘 AI 中的手写数字识别应用
  • JavaScript进阶-ES6 带来的高效编程新体验