当前位置: 首页 > news >正文

【机器学习】神经网络学习手册(四)损失函数

损失函数 Loss Function

用来衡量模型“错的有多离谱”

损失函数 = 模型预测值 vs 真实标签之间的差距

训练目标:找到一组权重,让损失函数的值最小化

- 损失越大 = 预测越差,需要优化

- 损失越小 = 预测越好,接近目标

常见的损失函数:

函数名中文名用途
MSE均方误差回归任务(预测房价、温度等连续值)
Cross-Entropy交叉熵分类任务(猫狗识别、手写数字等)
BCE二分类交叉熵二分类任务专用

(1)均方误差

数学公式:
MSC=1n∗∑(ypred,i−ytrue,i)2 MSC = \cfrac 1n * \sum (y_{pred,i} -y_{true,i})^2MSC=n1(ypred,iytrue,i)2
**特点:**对离群值敏感(误差被平方放大)

**用途:**房价预测 、股票预测、温度预测

代码实现:

defmse_loss(y_pred,y_true):returnnp.mean((y_pred-y_true)**2)

MSE对预测值的梯度求导得:
∂L∂ypred=2n(ypred−ytrue) \frac{\partial L}{\partial y_{\text{pred}}} = \frac{2}{n} (y_{\text{pred}} - y_{\text{true}})ypredL=n2(ypredytrue)

代码实现:

defmse_gradient(y_pred,y_true):n=len(y_pred)return2*(y_pred-y_true)/n

(2)交叉熵

数学公式:
L=−1n∑i=1nlog⁡(pi,ytrue,i) L = -\frac{1}{n} \sum_{i=1}^n \log(p_{i, y_{\text{true}, i}})L=n1i=1nlog(pi,ytrue,i)

其中pi,ytrue,ip_{i, y_{\text{true}, i}}pi,ytrue,i是第iii个样本正确类别的预测概率

特点:

  • 对错误分类惩罚呈指数级增长
  • 如果模型对正确类别给出高概率(如 0.99),损失很小(≈0.01)
  • 如果模型对正确类别给出低概率(如 0.01),损失很大(≈4.6)
  • 模型越不自信,惩罚越重

用途:图像分类、文本分类、多类别识别任务

代码实现:

defcross_entropy_loss(probs,y_true_idx):n=len(probs)correct_probs=probs[np.arange(n),y_true_idx]correct_probs=np.clip(correct_probs,1e-12,1.0)# 防止 log(0)return-np.mean(np.log(correct_probs))defsoftmax(x):x_shifted=x-np.max(x,axis=-1,keepdims=True)exp_x=np.exp(x_shifted)returnexp_x/np.sum(exp_x,axis=-1,keepdims=True)

(3)二分类交叉熵

数学公式:

L=−1n∑i=1n[yilog⁡(pi)+(1−yi)log⁡(1−pi)] L = -\frac{1}{n} \sum_{i=1}^{n} \left[ y_i \log(p_i) + (1 - y_i) \log(1 - p_i) \right]L=n1i=1n[yilog(pi)+(1yi)log(1pi)]

其中pip_ipi是预测为正类的概率,yi∈{0,1}y_i \in \{0, 1\}yi{0,1}是真实标签

特点:

  • 专门用于二分类问题(是/否、真/假、正例/负例)
  • 当预测正确且自信时损失接近 0
  • 当预测错误时损失迅速增大

用途:垃圾邮件检测、欺诈检测、疾病筛查、点击率预测

代码实现:

defbinary_cross_entropy(y_pred,y_true):""" 二分类交叉熵 (Binary Cross Entropy) 公式: L = -[y*log(p) + (1-y)*log(1-p)] """epsilon=1e-12y_pred=np.clip(y_pred,epsilon,1-epsilon)return-np.mean(y_true*np.log(y_pred)+(1-y_true)*np.log(1-y_pred))

http://www.jsqmd.com/news/863263/

相关文章:

  • Logisim-evolution实战:从图形化设计到FPGA实现的完整HDL工作流
  • 拯救者工具箱:如何用开源工具完全掌控你的联想游戏本性能
  • GitHub中文界面终极解决方案:3分钟免费实现全面中文化
  • 有实力的科净炭纤维加工厂推荐,江苏科净炭纤维实力出众 - myqiye
  • 2026年最新攻略:沃尔玛购物卡回收变现全流程详解 - 团团收购物卡回收
  • 茉莉花插件:Zotero中文文献管理的终极解决方案,5分钟打造高效科研工作流
  • Linux网络编程(六):UDP聊天室与线程池
  • 绝地求生罗技鼠标宏压枪脚本终极配置指南:从零到精通的完整解决方案
  • 字节Seedance、快手可灵、阿里HappyHorse逐鹿AI视频市场,谁能构建“循环生态”?
  • 推荐北京专业假发店,脱发做增发选哪家靠谱? - myqiye
  • 129、运动控制中的软件架构:分层设计
  • Logisim-evolution数字电路设计实战:从图形化设计到FPGA实现的完整工作流
  • 在Matlab中绘制质点三维运动轨迹图
  • 如何高效使用小红书下载工具:简单实用的完整教程
  • 摆脱论文困扰!!2026最新AI论文写作工具测评与推荐
  • 【观点】意图共鸣科技:2026年企业AI转型不是技术之争,是“第二大脑”与“裁员刀”的理念之争
  • 水机自动化元件BZL-10C轴电流继电器监测装置
  • 2026年口碑好的预制叠合板厂家,性能与价格综合分析哪家强 - myqiye
  • 2026年呼和浩特就近学车考驾照机构选购推荐 - 品牌推广大师
  • 武商一卡通回收技巧大揭秘,这些方法帮你顺利回收! - 团团收购物卡回收
  • IX6012 vs ASM1812@ACP# 完整规格 场景对比|PIN-TO-PIN 直接替代、供货稳、支持快
  • 终极指南:3分钟学会用QMCDecode解锁QQ音乐加密格式
  • 2022版本的Android Studio把创建好的项目导出为.apk文件步骤:
  • 作业5:案例挑战
  • js核心概念
  • vue3+vite+springboot路径配置:维护统一的baseUrl
  • ncmdump终极指南:3步快速解密网易云音乐NCM格式,重获音乐掌控权
  • VSCode 文件搜索 files.exclude 配置如何提升索引速度
  • 3分钟快速上手SketchUp STL插件:从设计到3D打印的完整指南
  • Mos:macOS 鼠标滚轮太生硬?这款免费开源工具让你的滚轮爽如触控板