当前位置：首页 > news >正文

完整教程：第五章：支持向量机

news 2026/7/4 2:19:38

最好的决策边界？就是1. 什么

2. 数学背后的逻辑

目标函数

约束条件

怎么解？拉格朗日乘子法

3. 一个方便的手算实例

4. 软间隔 (Soft Margin)：容忍一点错误

5. 核函数 (Kernel Trick)：降维打击的逆向操作

总结

在机器学习的江湖里，支持向量机 (Support Vector Machine, SVM)无可争议的“王者”。在深度学习爆发之前，它以坚实的数学基础和出色的分类效果统治着各种数据挖掘任务。就是曾经

很多同学听到 SVM 会觉得它的数学推导很难，但其实它的核心思想非常简单直观。今天我们就剥开复杂的公式，看透 SVM 的本质。

1. 什么是最好的决策边界？

假设我们要把桌上的红豆和绿豆分开。我们当然可以画无数条线把它们隔开，但哪一条线才是最好的呢？

：就是SVM 的答案离“雷区”最远的那条线。

决策边界：就是我们画的那条线。
雷区（Margin）：边界两边的区域。
支持向量（Support Vectors）支撑起该边界的柱子，就是：那些离边界最近的点。它们就像只有这些点在真正决定边界的位置，其他的点（离得远的）其实并不重要。

我们希望这个“雷区”（Margin）越宽越好（Large Margin），因为路越宽，咱们的模型泛化能力越强，遇到新数据时越不容易出错。

2. 数学背后的逻辑

如何“算”出来的很有必要。就是虽然我们不想深陷数学泥潭，但理解 SVM

目标函数

超平面），由权重就是大家的目标是找到一个平面（在二维是线，高维 $w$ 和偏置 $b$ 决定。

为了让 Margin 最大化，经过数学推导（距离公式的倒数），本质上我们是在求 $||w||$ 的最小值。

约束条件

这不仅仅是求最小值，还得保证分得对。

对于每一个样本点，我们需要满足： $y_{i}(w^{T}\cdot\Phi(x_{i})+b)\ge1$

这就是说，所有的点都必须在“雷区”之外。

怎么解？拉格朗日乘子法

这是一个典型的“带约束的优化问题”。数学家们祭出了神器——拉格朗日乘子法。

凭借引入拉格朗日乘子 $\alpha$ ，我们将原始疑问转化为对偶问题：

$L(w,b,\alpha)=\frac{1}{2}||w||^{2}-\sum_{i=1}^{n}\alpha_{i}(y_{i}(w^{T}\cdot\Phi(x_{i})+b)-1)$

最终，我们只需要解出 $\alpha$ ，就能得到最优的权重 $w$ 和 $b$ 。

3. 一个简单的手算实例

为了让你更具体地理解，我们来看一个只有3个点的案例：

正例 (+1)： $x_1(3,3), x_2(4,3)$
负例 (-1)： $x_3(1,1)$

我们把数据代入拉格朗日目标函数，最终解得：

$\alpha_1 = 0.25$
$\alpha_2 = 0$ （说明点 $x_2$ 不是支持向量，对结果没影响）
$\alpha_3 = 0.25$

最终求得的决策边界方程为： $0.5x_{1}+0.5x_{2}-2=0$

看，艰难的算法在小素材上其实就是解方程组。

4. 软间隔 (Soft Margin)：容忍一点错误

现实世界的数据往往是不完美的，可能混杂着噪声。如果非要画一条线把所有点都完美分开，这条线可能会变得相当奇怪（过拟合），甚至根本画不出来。

这时候，SVM 引入了“软间隔”的概念。

大家允许一些点跑进“雷区”，甚至跑错阵营。
为此引入一个松弛因子 $\xi$ 和惩罚系数 $C$ 。

参数 C 的含义：

C 很大：意味着分类要求非常严格，容不得半点错误（容易过拟合）。
C 很小：意味着我们允许容忍更多的错误，追求更宽的边界（容易欠拟合）。

5. 核函数 (Kernel Trick)：降维打击的逆向管理

如果数据根本就不是线性的（比如一堆红豆围着一堆绿豆，呈同心圆状），画直线怎么分？

SVM 的绝招是：升维。

在二维平面分不开，我就把你映射到三维空间去！在更高维度，原来的非线性问题往往就变成了线性问题。然而，直接计算高维映射（比如把 3维映射到 9维）计算量太大了，甚至会爆炸。

这时候核函数 (Kernel Function) 登场了。

核函数的魔力：它不应该真正把信息映射到高维去计算，而是借助一个公式 $K(x,y)$ ，在低维空间就能直接算出高维空间里的内积。

效果：和映射到高维一样。
计算量：和低维一样快。

最常用的核函数是高斯核函数 (RBF)，它非常强大，可以将资料映射到无限维空间。

总结

支持向量机 (SVM) 的核心魅力在于：

最大间隔：追求最稳健的分类边界。
支持向量：只有少数关键点决定结果，计算效率高（预测时）。
核技巧：巧妙解决非线性分类问题。

纵然现在深度学习很火，但在小样本、非线性分类任务中，SVM 依然是一把极其锋利的宝剑。

查看全文

http://www.jsqmd.com/news/382645/

Prompt 缓存的四种策略：从精确匹配到语义检索

脉冲多普勒雷达（Pulse-Doppler Radar）核心原理

Yak学习3：基础语法3复合数据类型

智能菜谱推荐系统设计毕业设计源码(源码+lw+部署文档+讲解等)

《提示工程架构师进阶：提示设计迭代的深度优化实践》

宿舍管理系统优化设计计算机毕业设计(源码+lw+部署文档+讲解等)

企业车辆管理系统设计计算机毕设(源码+lw+部署文档+讲解等)

豆包大模型2.0发布，推理能力达到世界顶尖水平

如何识别企业的深度学习跨语言情感分析技术优势

PLC西门子杯比赛：三部十层电梯博图v15.1程序带wincc画面

神经符号方法在数学问题解析推理中的应用

从理论到实践：AI原生应用的幻觉缓解技术深度剖析

我赶论文熬3天没睡，亲测7款免费AI工具一键生成超长篇幅 - 麟书学长

Nodejs+vue+ElementUI网上流浪狗救助捐赠平台

掌握大数据领域数据架构，开启高效数据管理

Day21

计算机毕业设计 java 同城临期食品购买平台基于 Java 的同城临期食品交易平台设计与实现 Spring Boot 框架下临期食品购买与配送管理系统开发

Avalonia 中多个 Grid 实现 SharedSizeGroup

市场竞争中的博弈论模型：价格战、信息博弈与企业长期策略

【C#高级】TCP请求-应答模式的WPF应用实战 - 实践

BISHI46 小红的魔法药剂

格雷厄姆特价股票策略在不同市场信息不对称下的表现

2026年2月西安防控眼镜配镜店推荐，三维数据透视专业防控机构 - 品牌鉴赏师

2026年2月贵阳高散眼镜配镜时尚眼镜店推荐，复杂散光精准适配指南 - 品牌鉴赏师

题解：P6961 [NEERC 2017] Journey from Petersburg to Moscow

题解：P12213 [蓝桥杯 2023 国 Python B] 最长回文前后缀

1. 什么是最好的决策边界？

2. 数学背后的逻辑

目标函数

约束条件

怎么解？拉格朗日乘子法

3. 一个简单的手算实例

4. 软间隔 (Soft Margin)：容忍一点错误

5. 核函数 (Kernel Trick)：降维打击的逆向管理

总结

相关文章：