当前位置: 首页 > news >正文

深度学习--卷积神经网络(上) - 教程

卷积神经网络

1、图像原理

图像在计算机中是一堆按顺序排列的数字,数值为0到255。0表示最暗,255表示最亮。

上图是只有黑白颜色的灰度图,而更普遍的图片表达方式是RGB颜色模型,即红、绿、蓝三原色的色光以不同的比例相加,以产生多种多样的色光。RGB颜色模型中,单个矩阵就扩展成了有序排列的三个矩阵,也可以用三维张量去理解。 其中的每一个矩阵又叫这个图片的一个channel(通道),宽, 高, 深来描述。

2、图像识别

画面不变性

知道一个物体不管在画面左侧还是右侧,都会被识别为同一物体,这一特点就是不变性

传统神经网络

解决办法是:用大量物体位于不同位置的数据训练,同时增加网络的隐藏层个数从而扩大网络学习这些变体的能力。

3、原理

卷积就是1)什么

对图像(不同的窗口数据)和卷积核(一组固定的权重:因为每个神经元的多个权重固定,所以又可以看做一个恒定的滤波器filter)做内积(逐个元素相乘再求和)的操作就是所谓的『卷积』操作,也是卷积神经网络的名字来源。

2)卷积层

a.步长stride:每次滑动的位置步长。

b. 卷积核的个数:决定输出的depth厚度。同时代表卷积核的个数。

c. 填充值zero-padding:在外围边缘补充若干圈0,方便从初始位置以步长为单位可以刚好滑倒末尾位置,通俗地讲就是为了总长能被步长整除。

素材窗口每次移动两个步长取3*3的局部数据,即stride=2。

两组神经元(卷积核),即depth=2,意味着有两个滤波器。

zero-padding=1。

3)网络构架

4)卷积层计算结果

5)池化层

1.池化层作用

一种降采样,减小内容的空间大小,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合。

2.常见的池化层

最大池化、平均池化、全局平均池化、全局最大池化。

平均池化(average pooling):计算图像区域的平均值作为该区域池化后的值。

最大池化(max pooling):选图像区域的最大值作为该区域池化后的值。是最为常见的。

通常来说,CNN的卷积层之间都会周期性地插入池化层。

3.池化层操作方法

与卷积层类似,池化层运算符由一个固定形状的窗口组成,该窗口根据其步幅大小在输入的所有区域上滑动,为固定形状窗口(有时称为 池化窗口)遍历的每个位置计算一个输出。 然而,不同于卷积层中的输入与卷积核之间的互相关计算,池化层不包含参数。

4.最大池化原理分析

Max pooling的主要功能是压缩,却不会损坏识别结果。 这意味着卷积后的Feature Map中有对于识别物体不必要的冗余信息。 那么我们就反过来思考,这些“冗余”信息是如何产生的。

6)全连接层

当抓取到足以用来识别图片的特征后,接下来的就是如何进行分类。 全连接层(也叫前馈层)就可能用来将最终的输出映射到线性可分的空间。 通常卷积网络的最后会将末端得到的长方体平摊(flatten)成一个长长的向量,并送入全连接层配合输出层进行分类。

7)感受野

3通道: 卷积核为3个7*7的,则卷积核所得的参数个数为:3*(3*7*7)=441个就是例如图片

卷积核为3个3*3的3层,则卷积核所需要的参数个数为:3*(3*3*3)+3*(3*3*3) +3*(3*3*3) =243

4、卷积神经网络的多种模型

LeNet:第一个成功的卷积神经网络应用

AlexNet:类似LeNet,但更深更大。使用了层叠的卷积层来抓取特征(通常是一个卷积层马上一个max pooling层)

ZF Net:增加了中间卷积层的尺寸,让第一层的stride和filter size更小。

GoogLeNet:减少parameters数量,最后一层用max pooling层代替了全连接层,更重要的是Inception-v4模块的使用。

VGGNet:只使用3x3 卷积层和2x2 pooling层从头到尾堆叠。

ResNet:引入了跨层连接和batch normalization。 DenseNet:将跨层连接从头进行到尾。

http://www.jsqmd.com/news/436130/

相关文章:

  • 智能守护新选择:无源智能锁市场全景与优选厂家指南 - 品牌评测官
  • 2026机器视觉系统厂商实力排名:技术、市场与应用全面盘点 - 华Sir1
  • 知到智慧树视频课件课程下载工具,如何在电脑端下载知到智慧树视频课程课件资料PDF,PPT到本地?
  • 2026年北京即时修护面膜专业选型指南:快速补水/玻尿酸/B5修护/舒缓泛红面膜供应商推荐 - 品牌推荐官
  • 2026年广州问题性肌肤管理品牌优选指南 五大品质品牌企业参考 - 十大品牌榜
  • 2026设备管理系统厂商价值排行榜:十大主流厂商评分与推荐 - 华Sir1
  • 斯百德会展|专业活动策划公司的核心能力,藏在大型学术会议前期策划里 - 麦麦唛
  • 杭州绗亿科技|多平台验货数据实时看,决策快人一步 - 搭贝
  • 2026年 ARO/GRACO涂胶机厂家推荐排行榜:汽车玻璃/新能源电机/锂电涂胶机等精密涂胶设备专业实力解析 - 品牌企业推荐师(官方)
  • powershell 临时全局sockt5 代理
  • 2026年全国电力管哪家好?技术先进产能充足服务有保障 适配各类电力工程 - 深度智识库
  • 2026年广州孕期护理品牌优选指南 十大品质品牌企业参考 - 十大品牌榜
  • 2026年市场可靠的AI搜索企业选哪家,视频矩阵/信息流广告代运营/信息流广告/抖音广告代运营,AI搜索企业推荐排行榜单 - 品牌推荐师
  • 2026年土豆粉机设备选型推荐:天华机械小型/商用土豆粉机原理与报价参考 - 品牌推荐官
  • 2026别错过!千笔ai写作,口碑爆棚的AI论文软件
  • Tita项目集使用小技巧:关联项目统筹管理,进度追踪更高效
  • 2026广州最新母婴护理机构推荐:专业定制服务,守护新生家庭安心时光 - 十大品牌榜
  • 论文阅读“VLA-IN-THE-LOOP: ONLINE POLICY CORRECTION WITH WORLD MODELS FOR ROBUST ROBOTIC GRASPING“
  • 微博热搜榜单实时监控爬虫:从原理到落地,一文掌握热点自动抓取
  • 2026年T-BOX品牌实力排行白皮书:谁在定义车联终端的“硬核标准”? - 华Sir1
  • 学长亲荐 10个AI论文网站:MBA毕业论文写作必备工具测评与推荐
  • 为什么很多APP的动态贴纸会卡顿?问题可能出在美颜SDK
  • 赋能高端制造,解锁表面革新——等离子处理机行业全景与优质品牌解析 - 品牌推荐大师
  • 2026年3月英语录音转文字网站推荐,智能识别与品牌保障口碑之选 - 品牌鉴赏师
  • 研究生收藏!全网爆红的降AIGC网站 —— 千笔·专业降AI率智能体
  • 2026重庆货架厂家TOP5榜单:成渝经济圈仓储设备选型指南 - 深度智识库
  • 采购必看:个人剂量仪/个人剂量报警仪市场主流品牌及头部企业全方位盘点 - 品牌推荐大师1
  • 2026年3月在线视频转文字平台推荐,智能识别与品牌保障口碑之选 - 品牌鉴赏师
  • 真的太省时间!8个降AI率平台测评对比,自考降AI率必备神器
  • 少走弯路:专科生专属AI论文写作神器 —— 千笔·专业学术智能体