深度学习机器学习基础最大似然与贝叶斯统计(十九)
1. 定位导航
前面几篇讲了怎么衡量一个模型好不好(偏差、方差、过拟合)。本篇回答更深层的问题:损失函数从哪里来?
答案是最大似然估计——训练神经网络的所有损失函数(MSE、交叉熵、NLL)本质上都是 MLE 在不同概率模型假设下的具体形式。
2. 最大似然估计(Maximum Likelihood Estimation)
2.1 概念直觉
似然(Likelihood):给定参数θ\boldsymbol{\theta}θ,观测到这组训练数据的概率有多大?
最大似然:找到那个让"观测到这组数据
