当前位置: 首页 > news >正文

14-机器学习与大模型制作数学教程-第1章 1-6 费马定理与极值判定

数学中的就是在机器学习中,我们常常听到“找到损失函数的最小值”或者“模型在验证集上表现最好”。这里的“最好”其实就极值问题。而极值的判定离不开费马定理(Fermat’s Theorem)以及随之而来的判别方法。


1. 生活类比:上下坡与停车点

想象你骑自行车上坡,下坡,最终到达山谷或者山顶。

  • 在山顶(极大值点),你的速度一瞬间降为零,再开始下滑。
  • 在山谷(极小值点),你的速度也会归零,然后才开始爬坡。

结论:在极值点,切线斜率通常为 0。
这就是费马定理的核心思想。


2. 费马定理(Fermat’s Theorem)

定理内容
如果函数 f(x)f(x)f(x) 在点 x0x_0x0处取得局部极值,且f(x)f(x)f(x)x0x_0x0处可导,那么:

f′(x0)=0f'(x_0) = 0f(x0)=0

换句话说:


3. 几何意义

导数代表切线斜率。

  • 在极大值点:函数先增后减,切线斜率从正变负,必然经过0
  • 在极小值点:函数先减后增,切线斜率从负变正,也必然经过0
导数为正: 上升
导数为0: 极大/极小候选点
导数为负: 下降
导数为正: 上升

图示说明:上图表示导数变化的过程。函数在导数为零的点,可能成为极大值或极小值的候选点。


4. 极值判定方法

找到候选点 f′(x)=0f'(x)=0f(x)=0后,我们还要进一步判定:

(1)一阶导数判别法

  • f′(x)f'(x)f(x)x0x_0x0 附近由 正 → 负,则 x0x_0x0 是极大值。
  • f′(x)f'(x)f(x)x0x_0x0 附近由 负 → 正,则 x0x_0x0 是极小值。
  • 若符号不变,则不是极值点。

(2)二阶导数判别法


5. 例子讲解

例子 1

f(x)=x2f(x) = x^2f(x)=x2

  • 一阶导:f′(x)=2xf'(x) = 2xf(x)=2x,解得候选点x=0x=0x=0
  • 二阶导:f′′(x)=2>0f''(x) = 2 > 0f′′(x)=2>0,所以 x=0x=0x=0是极小值点。

例子 2

f(x)=−x2f(x) = -x^2f(x)=x2

  • 一阶导:f′(x)=−2xf'(x) = -2xf(x)=2x,解得候选点x=0x=0x=0
  • 二阶导:f′′(x)=−2<0f''(x) = -2 < 0f′′(x)=2<0,所以 x=0x=0x=0是极大值点。

6. 在机器学习中的应用

在训练机器学习模型时,大家常常需要最小化损失函数

在大模型创建中,比如训练 GPT 这样的模型时:


7. 小结

  • 费马定理:极值点必定满足导数为零(或不可导)。
  • 极值判定:结合一阶导数符号变化或二阶导数正负来判断。
  • 技术延伸:机器学习优化问题的核心,就是不停地寻找这些极小值点。

所以,下次看到“梯度为零”时,可以立刻联想到:
这背后其实就是费马定理在起作用!

http://www.jsqmd.com/news/304933/

相关文章:

  • P1024 [NOIP 2001 提高组] 一元三次方程求解(1.26)
  • EDC电子试验记录本,数字化科研时代的效率革命
  • linux查询进程
  • python-Dgango项目收集静态文件、构建前端、安装依赖
  • 实用指南:【C++初阶】vector容器的模拟实现,各接口讲解
  • Linux、Windows常用命令
  • 2026年1月26日
  • 2026年地坪漆国内TOP十大品牌推荐:从技术实力到场景适配的专业选型指南
  • 生物等效性试验电子化记录,开启药品研发的智能合规新时代
  • 2026年地坪漆厂家配套固化剂品牌推荐:从适配性到稳定性的全维度选型指南
  • Docker常用命令
  • 生物等效性电子试验记录,数字化工具如何重塑药物研发新范式
  • 揭秘电子试验记录如何保障生物等效性,从数据基石到智能未来
  • EDC电子试验记录,现代科研的数字化革命与七大工具横评
  • 冥想第一千七百七十五天(1775)
  • 中国象棋 算棋不求
  • 环境检测LIMS系统:LIMS如何将环境检测实验室从“经验驱动”转向“数据决策”?
  • AI营销专家原圈科技:从ROI提升300%看AI营销变革
  • AI营销专家榜首揭晓:原圈科技如何实现300% ROI增长?
  • NX MCD时序仿真的学习模板,包涵运行时参数,运行时表达式,条件仿真序列的编写等等。 关键是...
  • 强烈安利10个AI论文软件,专科生毕业论文写作神器!
  • MATLAB代码:基于粒子群算法的储能优化配置(可加入风光机组) 关键词:储能优化配置 粒子群...
  • 大数据领域数据交易的安全挑战与解决方案
  • 基于深度强化学习的微能源网能量管理与优化策略研究:利用DQN实现智能管理与价值决策算法
  • 日志数据结构化处理:使用Logstash过滤器实现日志格式标准化
  • omron欧姆龙NJ/NX程序 全自动锂电池二封机,主站NJ501-1400+威纶通触摸屏
  • 2026最详细的由于找不到msvcr110.dll 无法继续执行修复方案分析
  • MATLAB代码:基于多智能体系统一致性算法的电力系统分布式经济调度策略 关键词
  • FPGA 1553B IP源码 支持BC、BM、RT 移植简单 Verilog源码 实际项目验证
  • GitHub 热榜项目 - 日榜(2026-01-26)