当前位置: 首页 > news >正文

机器学习基础(四):损失函数与优化目标

一、引入

在上一节中,我们已经学习了如何利用梯度下降来不断优化参数。

但一个更本质的问题是:

模型如何判断当前的预测是“好”还是“坏”?

要回答这个问题,我们需要引入一个核心概念——损失函数。


二、从误差到损失函数

在正式讨论损失函数之前,我们先来看“误差(Error)”:

\[\text{误差} = \text{预测值} - \text{真实值} \]

误差可以衡量单个样本的预测偏差,但当样本数量增多时,会出现一个问题:

正负误差可能相互抵消

例如:一个预测误差为 +1,另一个为 -1,总误差可能为 0,但显然模型并不完美。

因此,我们需要一种不会相互抵消的整体度量方式,这就是损失函数。


三、什么是损失函数

损失函数(Loss Function)用于衡量模型预测值与真实值之间的整体差距。

一般来说:

损失函数的值越小,模型预测效果越好

不同任务会选择不同的损失函数。


四、常见损失函数

1. 均方误差(MSE)

\[L = \frac{1}{n} \sum (y_i - \hat{y}_i)^2 \]

特点:

  • 对较大误差惩罚更强
  • 函数平滑,易于求导(适合梯度下降)
  • 常用于回归问题

2. 平均绝对误差(MAE)

\[L = \frac{1}{n} \sum |y_i - \hat{y}_i| \]

特点:

  • 对异常值更鲁棒
  • 对误差的惩罚是线性的
  • 但在 0 附近不可导(优化略复杂)

3. 交叉熵损失(Cross Entropy)

\[L = -\sum y \log \hat{y} \]

特点:

  • 常用于分类问题
  • 能有效衡量概率分布之间的差异
  • 在深度学习中非常常见

五、从损失函数到优化目标

损失函数给出了一个“评价标准”,而机器学习的目标就是:

\[\min_{\theta} L(\theta) \]

也就是说,我们希望找到一组参数,使损失函数的值尽可能小。


六、损失函数与梯度下降

可以从几何角度来理解二者的关系:

  • 损失函数:定义了一片“地形”(高维曲面)
  • 参数:对应地形中的一个位置
  • 梯度下降:沿着坡度下降,寻找最低点

因此:

损失函数决定“往哪里去”
梯度下降决定“怎么去”


七、总结

  • 误差描述单个样本的偏差
  • 损失函数衡量整体预测效果
  • 优化目标是最小化损失函数
  • 梯度下降用于实现这一优化过程

损失函数回答“什么是好”
梯度下降回答“如何变好”

二者共同构成了机器学习中最核心的优化机制。

http://www.jsqmd.com/news/546379/

相关文章:

  • 从RS485到TCP/IP:Modbus协议V1.1b3的三种组网方式对比(含WireShark抓包分析)
  • AI引擎排名优化GEO源码系统分享 带完整的搭建部署教程
  • 西门子S7-300 PLC与ET200S分布式IO实战:5步搞定PROFIBUS总线组态
  • 当ECU说‘不’时:一份给汽车诊断工程师的UDS负响应码(NRC)实战排查手册
  • CentOS7下NFS共享报错RPC问题的3种解决方案(含防火墙配置详解)
  • 别再让电费偷偷溜走!用智能时间开关改造家里的热水器和空调(附保姆级选购指南)
  • 煤矿电液阀系统摄像仪护套连接器 DLJ01(1000)参数
  • Phi-4-Reasoning-Vision行业落地:教育领域图像题解与隐藏线索识别案例
  • 视觉语言模型VLM高效部署:基于TensorRT-LLM的C++推理实践
  • 微信支付服务商模式踩坑实录:JSAPI支付在公众号和小程序里调不通?可能是这两个参数搞的鬼
  • 项目分享|VibeVoice:微软开源的前沿语音AI
  • 格密码学入门:从线性代数到Lattice Cryptography的实战指南
  • P3803 【模板】多项式乘法(FFT/NTT)
  • 宇树机器狗go2仿真避坑指南:如何用Velodyne VLP-16雷达降低电脑负载(附完整配置流程)
  • Phi-4-Reasoning-Vision基础教程:双卡4090环境安装、镜像拉取与端口映射
  • 请解释什么是 Docker Swarm,并描述其主要功能。
  • StructBERT情感模型快速部署:镜像免配置+毫秒响应实测分享
  • 用STC89C52RC单片机+L298N驱动模块,做个可调直流电源(附PWM控制代码)
  • 别再让液冷板成为瓶颈:结构热设计规范+仿真技术要点全在这
  • LVGL 7.11.0 Chart控件实战:5分钟搞定动态心率折线图(附完整代码)
  • 智能微电网中利用粒子群算法实现多目标优化 有完整数据可运行 :智能微电网中对多目标问题的优化...
  • 三步掌握Dark Reader:从入门到精通的护眼浏览解决方案
  • 告别电脑噪音:用开源风扇控制工具打造个性化散热方案
  • 如何用PWM精准控制45步进电机速度?从0.5KHz到8KHz实战解析
  • OriginCar传感器数据可视化实战:FoxGlove从安装到ROS通信的全流程配置
  • 避坑指南:Go语言decimal库四舍五入的3种姿势对比(含银行家舍入场景)
  • 不止于提取:用ArcMap 10.0水文工具链,为你的SWAT/HEC-HMS模型准备完美流域输入数据
  • 用LDA模型挖掘微信聊天秘密:Gensim实战教程(含pyLDAvis可视化)
  • VESC项目必备!用Makerbase Davega模块打造你的电动车仪表盘(支持GPS/里程记录)
  • DREAMER数据集实战:基于EEG与ECG的多模态情绪识别技术解析