当前位置: 首页 > news >正文

零基础学AI人工智能:10.3 ANN人工神经网络

承接上一篇 PyTorch 框架的工程基础内容,我们正式进入神经网络的基础结构学习。ANN(人工神经网络)是所有深度学习网络的底层原型,它模拟生物大脑神经元的连接逻辑搭建计算结构,具备极强的非线性拟合能力。本篇将从结构概述、激活函数、参数初始化、损失函数、优化策略、正则化、工程搭建全流程拆解 ANN 的完整知识体系。

一、ANN 人工神经网络概述

1.1核心定义

ANN 通过神经元相互连接搭建计算网络,模拟生物神经网络的信息传递逻辑,实现对现实复杂事物规律的拟合,完成分类、回归等各类机器学习任务。

1.2网络结构组成

标准全连接 ANN 分为三层结构:

  1. 输入层:神经元数量等于样本的特征列数,负责接收原始输入特征;
  2. 隐藏层:可以设置多层,为网络引入非线性拟合能力,让网络可以处理复杂任务;同层神经元之间无连接,本层每个神经元会和上一层所有神经元建立全连接,搭配专属的权重w与偏置b
  3. 输出层:根据任务类型设置神经元数量,输出最终预测结果。

二、常用激活函数

激活函数是给神经网络引入非线性能力的核心组件,若无激活函数,多层全连接网络等价于单层线性模型,无法拟合复杂模式。主流激活函数特性与适用场景如下:

激活函数

取值范围

特性与适用场景

Sigmoid

输出(0,1),导数(0,0.25)

兼顾正负样本,易出现梯度饱和,多用于二分类任务的输出层

Tanh

输出(-1,1),导数(-1,1)

正负样本区分效果更明显,多用于隐藏层

ReLU

正数保留、负数置 0

仅考虑正样本,缓解深层网络梯度消失;衍生变体 Leaky ReLU、PReLU 解决了原生 ReLU 神经元死亡的缺陷,是深层网络隐藏层的首选

Softmax

所有输出和为 1

将加权结果转化为类别概率分布,专门用于多分类任务的输出层

2.1 激活函数选择通用策略

  1. 隐藏层:ReLU 及变体优先 > Tanh > Sigmoid
  2. 二分类输出层:Sigmoid
  3. 多分类输出层:Softmax
  4. 回归输出层:线性恒等映射 Identity

三、参数的初始化

3.1初始化目的

合理设置权重、偏置的初始值,可以有效加快模型收敛速度,避免训练初期就出现梯度消失 / 梯度爆炸问题。

3.2常用初始化方案

1. 基础通用初始化:

均匀分布uniform_、正态分布normal_、全零zeros_、全一ones_、自定义常数constant_

2. 适配激活函数的优化初始化:

1. Kaiming 初始化(kaiming_uniform_/kaiming_normal_):专门适配 ReLU 系列激活函数;

2. Xavier 初始化(xavier_uniform_/xavier_normal_):适配 Tanh、Sigmoid 类激活函数。

四、损失函数

损失函数用来衡量模型预测结果和真实标签的差距,是模型优化的目标依据,根据任务类型分为三类:

4.1回归任务(连续值预测)

常用指标:MSE 均方误差、MAE 平均绝对误差、RMSE 均方根误差、SmoothL1 平滑 L1 损失。

4.2分类任务(离散类别预测)

深度学习主流使用交叉熵损失:二分类任务用二分类交叉熵,多分类任务用多分类交叉熵。

4.3聚类任务

常用 SSE 误差平方和、CH 轮廓系数这类聚类评估指标作为优化目标。

五、梯度下降优化介绍

梯度下降是 ANN 更新参数、最小化损失的核心算法,原生梯度下降存在训练瓶颈,有两类主流优化方向:

5.1原生梯度下降的痛点

在参数空间的平缓区域下降速度极慢,且容易陷入局部最优,无法找到全局最优解。

5.2优化改进方案

  1. 梯度层面优化(动量 + 自适应学习率):依次衍生出动量 Momentum、AdaGrad、RMSprop,最终整合出工业界广泛使用的 Adam 自适应优化器;
  2. 学习率策略优化:分为手动调整固定学习率、自适应学习率优化两大类。

六、正则化相关

正则化的核心目标是缓解模型过拟合,思维导图介绍了两种最常用的方案:

6.1 Dropout随机失活

训练阶段会以设定概率p(通常取0.2∼0.5)随机让部分神经元失效,同时用1/(1-p)缩放保留神经元的权重;测试阶段会关闭该机制。可以削弱批次训练中样本差异带来的过拟合问题。

6.2 BN批量归一化

对每一批次的输入数据做标准化处理,再加入平移、缩放参数修正分布,解决训练过程中的内部协变量偏移问题,大幅加快训练收敛速度,提升模型泛化能力。

七、如何搭建人工神经网络

7.1前期思路分析(编码前必做)

  1. 统计数据集的特征列数,确定输入层神经元数量;
  2. 规划隐藏层的层数、每层的神经元个数;
  3. 分析输出层:判断任务是二分类 / 多分类 / 回归,确定输出神经元数量;
  4. 为每一层匹配适配的激活函数、参数初始化方式。

7.2 PyTorch实现流程

  1. 自定义网络类,继承nn.Module基类;
  2. __init__()方法中定义、搭建网络各层结构;
  3. forward()方法中编写前向传播逻辑,最终返回预测结果。

7.3扩展调试工具

可以使用torchsummary库的summary()函数,一键统计网络的参数量、每层维度等信息,方便结构调试。

八、总结

ANN 是深度学习所有复杂网络的基础原型,完整掌握它的结构设计、激活函数选型、参数初始化、损失与优化、正则化、工程落地全流程,就具备了搭建基础神经网络的能力。后续会基于 ANN 的原理,拓展适配图像任务的卷积神经网络 CNN。

http://www.jsqmd.com/news/1075393/

相关文章:

  • iOS安全测试框架Needle:自动化漏洞挖掘与移动应用安全评估实战指南
  • 终极AI视频插值指南:使用Flowframes轻松提升视频帧率的完整教程
  • 小红书广告视频记录
  • 遗传算法实操避坑指南:实数编码、自适应变异与精英保留
  • 量子密码分析研究
  • FPGA数据流编程与HLS优化实战指南
  • 告别打卡焦虑:5分钟掌握Android自动打卡终极方案
  • 架构设计理念与核心哲学
  • MetaboAnalystR 4.3.0架构解析:500+函数构建的代谢组学分析技术框架
  • 2026 年易柯森特:北京民营企业借工程监理优化施工管理
  • 终极指南:689款开源macOS应用全收录,打造你的专属生产力工具箱!
  • 5大核心优势:为什么LibreSignage是中小型场所数字标牌的最佳选择
  • 注塑模与冲压模
  • 当手机里的待办事项堆积如山——我在 HarmonyOS 上给列表装了个多选删除功能
  • 5分钟搞定Linux启动盘制作:Deepin Boot Maker终极指南
  • 5分钟掌握Android台球辅助神器:精准瞄准终极指南
  • 3分钟掌握Obsidian Excel表格转换:终极Markdown表格解决方案
  • 如何利用开源工具高效绕过iOS 15-16激活锁:专业解决方案指南
  • 一、前置环境校验
  • C++ NRVO
  • Mac NTFS读写终极方案:3分钟免费解决跨平台文件传输难题
  • PostgreSQL PERCENT_RANK() 窗口函数完全解析
  • STM32-S345-双轴追光+太阳能+锂电池电压+电量+充电电压+4光敏+2电机+OLED屏+手动自动+升压+按键+(无线方式选择)-3(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)
  • 亚博科技APP广告片记录
  • 跨境电商多账号防关联,我如何用指纹浏览器解决“一锅端”问题
  • Sunshine游戏串流终极指南:打造专属云游戏服务器的完整教程
  • DeepSeek模型实战:多模态解析与国产算力部署指南
  • PCB信号线阻抗介绍
  • 终极智能钓鱼助手:渔人的直感让FF14钓鱼变得如此简单
  • 碧蓝航线Alas自动化脚本:全功能游戏助手解放你的游戏时间