当前位置: 首页 > news >正文

完整教程:第五章:支持向量机

目录

最好的决策边界?就是1. 什么

2. 数学背后的逻辑

目标函数

约束条件

怎么解?拉格朗日乘子法

3. 一个方便的手算实例

4. 软间隔 (Soft Margin):容忍一点错误

5. 核函数 (Kernel Trick):降维打击的逆向操作

总结


在机器学习的江湖里,支持向量机 (Support Vector Machine, SVM)无可争议的“王者”。在深度学习爆发之前,它以坚实的数学基础和出色的分类效果统治着各种数据挖掘任务。就是曾经

很多同学听到 SVM 会觉得它的数学推导很难,但其实它的核心思想非常简单直观。今天我们就剥开复杂的公式,看透 SVM 的本质。

1. 什么是最好的决策边界?

假设我们要把桌上的红豆和绿豆分开。我们当然可以画无数条线把它们隔开,但哪一条线才是最好的呢?

:就是SVM 的答案离“雷区”最远的那条线。

  • 决策边界:就是我们画的那条线。

  • 雷区(Margin):边界两边的区域。

  • 支持向量(Support Vectors)支撑起该边界的柱子,就是:那些离边界最近的点。它们就像只有这些点在真正决定边界的位置,其他的点(离得远的)其实并不重要。

我们希望这个“雷区”(Margin)越宽越好(Large Margin),因为路越宽,咱们的模型泛化能力越强,遇到新数据时越不容易出错。


2. 数学背后的逻辑

如何“算”出来的很有必要。就是虽然我们不想深陷数学泥潭,但理解 SVM

目标函数

超平面),由权重就是大家的目标是找到一个平面(在二维是线,高维$w$和偏置$b$ 决定。

为了让 Margin 最大化,经过数学推导(距离公式的倒数),本质上我们是在求$||w||$ 的最小值。

约束条件

这不仅仅是求最小值,还得保证分得对。

对于每一个样本点,我们需要满足:$y_{i}(w^{T}\cdot\Phi(x_{i})+b)\ge1$

这就是说,所有的点都必须在“雷区”之外。

怎么解?拉格朗日乘子法

这是一个典型的“带约束的优化问题”。数学家们祭出了神器——拉格朗日乘子法。

凭借引入拉格朗日乘子$\alpha$,我们将原始疑问转化为对偶问题:

$L(w,b,\alpha)=\frac{1}{2}||w||^{2}-\sum_{i=1}^{n}\alpha_{i}(y_{i}(w^{T}\cdot\Phi(x_{i})+b)-1)$

最终,我们只需要解出$\alpha$,就能得到最优的权重$w$$b$


3. 一个简单的手算实例

为了让你更具体地理解,我们来看一个只有3个点的案例:

  • 正例 (+1)$x_1(3,3), x_2(4,3)$

  • 负例 (-1)$x_3(1,1)$

我们把数据代入拉格朗日目标函数,最终解得:

  • $\alpha_1 = 0.25$

  • $\alpha_2 = 0$(说明点$x_2$不是支持向量,对结果没影响)

  • $\alpha_3 = 0.25$

最终求得的决策边界方程为:$0.5x_{1}+0.5x_{2}-2=0$

看,艰难的算法在小素材上其实就是解方程组。


4. 软间隔 (Soft Margin):容忍一点错误

现实世界的数据往往是不完美的,可能混杂着噪声。如果非要画一条线把所有点都完美分开,这条线可能会变得相当奇怪(过拟合),甚至根本画不出来。

这时候,SVM 引入了“软间隔”的概念。

  • 大家允许一些点跑进“雷区”,甚至跑错阵营。

  • 为此引入一个松弛因子$\xi$和惩罚系数 $C$

参数 C 的含义

  • C 很大:意味着分类要求非常严格,容不得半点错误(容易过拟合)。

  • C 很小:意味着我们允许容忍更多的错误,追求更宽的边界(容易欠拟合)。


5. 核函数 (Kernel Trick):降维打击的逆向管理

如果数据根本就不是线性的(比如一堆红豆围着一堆绿豆,呈同心圆状),画直线怎么分?

SVM 的绝招是:升维。

在二维平面分不开,我就把你映射到三维空间去!在更高维度,原来的非线性问题往往就变成了线性问题。然而,直接计算高维映射(比如把 3维 映射到 9维)计算量太大了,甚至会爆炸。

这时候核函数 (Kernel Function) 登场了。

核函数的魔力:它不应该真正把信息映射到高维去计算,而是借助一个公式$K(x,y)$,在低维空间就能直接算出高维空间里的内积。

  • 效果:和映射到高维一样。

  • 计算量:和低维一样快。

最常用的核函数是高斯核函数 (RBF),它非常强大,可以将资料映射到无限维空间。


总结

支持向量机 (SVM) 的核心魅力在于:

  1. 最大间隔:追求最稳健的分类边界。

  2. 支持向量:只有少数关键点决定结果,计算效率高(预测时)。

  3. 核技巧:巧妙解决非线性分类问题。

纵然现在深度学习很火,但在小样本、非线性分类任务中,SVM 依然是一把极其锋利的宝剑。

http://www.jsqmd.com/news/382645/

相关文章:

  • Prompt 缓存的四种策略:从精确匹配到语义检索
  • 2026年玻璃钢盖板厂家推荐排行榜:涵盖拱型/圆形/密闭式/模压等耐酸碱防臭盖板,精选优质源头企业实力解析 - 品牌企业推荐师(官方)
  • 脉冲多普勒雷达(Pulse-Doppler Radar)核心原理
  • 2026年 活动场地推荐榜单:拍摄/演出/音乐节/演唱会/片场/秀场/发布会/路演/比赛场地一站式创意空间甄选 - 品牌企业推荐师(官方)
  • Yak学习3:基础语法3复合数据类型
  • 智能菜谱推荐系统设计毕业设计源码(源码+lw+部署文档+讲解等)
  • 2026年 AI生成用例工具推荐榜单:一站式/专业/高效/智能/精准/全面/快速/自动化/定制化/企业级工具深度解析与选购指南 - 品牌企业推荐师(官方)
  • 《提示工程架构师进阶:提示设计迭代的深度优化实践》
  • 2026年 监控塔厂家推荐排行榜:边防/林火/安防瞭望监控塔,高空防火监控塔实力品牌深度解析与选购指南 - 品牌企业推荐师(官方)
  • 宿舍管理系统优化设计计算机毕业设计(源码+lw+部署文档+讲解等)
  • 企业车辆管理系统设计计算机毕设(源码+lw+部署文档+讲解等)
  • 豆包大模型2.0发布,推理能力达到世界顶尖水平
  • 如何识别企业的深度学习跨语言情感分析技术优势
  • PLC西门子杯比赛:三部十层电梯博图v15.1程序带wincc画面
  • 神经符号方法在数学问题解析推理中的应用
  • 从理论到实践:AI原生应用的幻觉缓解技术深度剖析
  • 我赶论文熬3天没睡,亲测7款免费AI工具一键生成超长篇幅 - 麟书学长
  • Nodejs+vue+ElementUI网上流浪狗救助捐赠平台
  • 掌握大数据领域数据架构,开启高效数据管理
  • Day21
  • 计算机毕业设计 java 同城临期食品购买平台 基于 Java 的同城临期食品交易平台设计与实现 Spring Boot 框架下临期食品购买与配送管理系统开发
  • Avalonia 中多个 Grid 实现 SharedSizeGroup
  • 市场竞争中的博弈论模型:价格战、信息博弈与企业长期策略
  • 【C#高级】TCP请求-应答模式的WPF应用实战 - 实践
  • BISHI46 小红的魔法药剂
  • 格雷厄姆特价股票策略在不同市场信息不对称下的表现
  • 2026年2月西安防控眼镜配镜店推荐,三维数据透视专业防控机构 - 品牌鉴赏师
  • 2026年2月贵阳高散眼镜配镜时尚眼镜店推荐,复杂散光精准适配指南 - 品牌鉴赏师
  • 题解:P6961 [NEERC 2017] Journey from Petersburg to Moscow
  • 题解:P12213 [蓝桥杯 2023 国 Python B] 最长回文前后缀