当前位置：首页 > news >正文

费希尔线性判别分析(FLD)原理与Python实现

news 2026/4/25 20:19:39

1. 费希尔线性判别分析的核心思想

费希尔线性判别分析（Fisher's Linear Discriminant, FLD）是模式识别领域经典的线性分类方法，由统计学家Ronald Fisher在1936年提出。它的核心思想非常直观：找到一个最优的投影方向，使得不同类别的样本在这个方向上的投影能够最大程度地分离。

想象你面前有两堆不同颜色的弹珠混杂在一起。FLD就像是在寻找一个最佳的倾斜角度来观察这些弹珠，使得从这个角度看过去，红色弹珠和蓝色弹珠分别聚集在两个明显分开的区域。这个"最佳角度"就是FLD要找的投影方向。

2. 数学原理与推导过程

2.1 类内散度与类间散度

FLD的数学之美在于它巧妙地定义了两个关键概念：

类内散度矩阵（Within-class scatter matrix）衡量的是同一类别样本的分散程度：

S_W = Σ_{i=1}^c Σ_{x∈X_i} (x - μ_i)(x - μ_i)^T

类间散度矩阵（Between-class scatter matrix）则衡量不同类别均值之间的分散程度：

S_B = Σ_{i=1}^c N_i (μ_i - μ)(μ_i - μ)^T

其中c是类别数，μ_i是第i类的均值，μ是所有样本的总体均值。

2.2 优化目标的建立

FLD的目标是找到一个投影方向w，使得投影后的数据满足：

J(w) = (w^T S_B w)/(w^T S_W w)

这个比值最大化意味着：

分子最大化 → 类间距离尽可能大
分母最小化 → 类内距离尽可能小

这实际上是在寻找一个方向，使得不同类别的样本在这个方向上投影后的"信号噪声比"最大。

2.3 求解过程

通过拉格朗日乘数法，我们可以将这个优化问题转化为广义特征值问题：

S_B w = λ S_W w

对于二分类情况，解可以显式表示为：

w = S_W^{-1} (μ_1 - μ_2)

这个简洁的公式就是FLD的核心所在 - 它告诉我们最优投影方向与类内散度的逆和类别均值差有关。

3. 实际应用与Python实现

3.1 数据预处理要点

在应用FLD前，有几个关键预处理步骤：

数据标准化：由于FLD对尺度敏感，建议先对特征进行标准化
类别平衡：严重不平衡的数据会影响FLD效果
维度检查：确保样本数大于特征数，否则S_W可能不可逆

3.2 Python代码实现

使用scikit-learn的实现示例：

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis import numpy as np # 生成示例数据 np.random.seed(42) X1 = np.random.multivariate_normal([0,0], [[1,0.5],[0.5,1]], 100) X2 = np.random.multivariate_normal([2,2], [[1,-0.5],[-0.5,1]], 100) X = np.vstack([X1, X2]) y = np.array([0]*100 + [1]*100) # 训练FLD模型 lda = LinearDiscriminantAnalysis() lda.fit(X, y) # 查看投影方向 print("投影方向:", lda.coef_)

3.3 结果可视化技巧

可视化是理解FLD效果的关键。我们可以这样展示：

import matplotlib.pyplot as plt # 原始数据分布 plt.scatter(X[:,0], X[:,1], c=y, alpha=0.5) # 绘制FLD决策边界 x_min, x_max = plt.xlim() y_min, y_max = plt.ylim() xx, yy = np.meshgrid(np.linspace(x_min, x_max, 100), np.linspace(y_min, y_max, 100)) Z = lda.predict(np.c_[xx.ravel(), yy.ravel()]) Z = Z.reshape(xx.shape) plt.contourf(xx, yy, Z, alpha=0.2) # 绘制投影方向 w = lda.coef_[0] plt.quiver(0, 0, w[0], w[1], angles='xy', scale_units='xy', scale=1, color='r') plt.show()