当前位置: 首页 > news >正文

09. 集成学习

一、集成学习

  集成学习通过某种策略组合多个个体学习器的预测结果来提高整体的预测能力。只包含同种类型的个体学习器的集成称为 同质集成。同质集成中的各个学习器亦称为 基学习器,相应的学习算法称为 基学习算法。包含不同类型的个体学习器的集成称为 异质集成

  集成学习有三大经典方法:BoostingBaggingStacking

  • Boosting(提升方法):按顺序训练模型,每个模型关注前一个模型的错误,通过加权调整来优化整体预测。
  • Bagging(自助聚合):从原始数据集中通过有放回的对样本采样生成多个子数据集,分别训练多个独立模型,最后通过投票(分类)或平均(回归)得到结果。
  • Stacking(堆叠):训练多个不同类型的个体学习器,之后使用一个元模型综合多个个体学习器的预测。灵活性强,能结合多种模型的优势。

二、AdaBoost

  在概率近似正确学习的框架中,一个概念如果存在一个多项式的学习算法能够学习它,并且正确率很高,就称这个概念是 强可学习的。一个概念如果存在一个多项式的学习算法能够学习它,但正确率仅比随机猜测略好,就称这个概念是 弱可学习的。后来证明,强可学习与弱可学习是等价的。

  对于分类问题而言,给定一个训练数据集,求比较粗糙的分类规则(弱分类器)要比求精确的分类规则(强分类器)容易的多。Boosting 就是从弱学习算法出发,反复学习,得到一系列弱分类器,然后组合这些弱分类器构成一个强分类器。AdaBoost 通常使用单层决策树作为基学习器,单层决策树也被称为 决策树桩

  大部分 Boosting 都是改变训练数据的概率分布(权重分布),针对不同的训练数据分布调用弱学习算法一系列弱分类器。AdaBoost(Adaptive Boosting,自适应提升)的做法是提高被前一轮弱分类错误分类的样本的权重,降低被正确分类的样本的权重。这样一来,后一轮弱学习器会更加关注那些没有被正确分类的数据。同时采用加权多数表决的方法,加大分类误差率小的弱分类器的权重,减少分类误差率大的弱分类器的权重。

三、随机深林

  随机深林是 Bagging 的一种变体,在以决策树为基学习器构建 Bagging 集成的基础上,进一步在决策树训练过程中引入随机属性选择。具体来说,传统决策树在选择划分特征时是在当前节点的特征集合(假定有 d 个特征)中选择最优特征。而在随机深林中,决策树的每个节点先从该节点的特征集合中随机选择一个包含 k 个特征的子集,然后再从这个子集中选择一个最优特征用于划分。参数 k 控制着随机性的引入程度。若 k = d,则基决策树的生成与传统决策树相同。若 k = 1,则随机选择一个属性用于划分,一般推荐 \(k = log_{2}d\)

  随机深林简单易实现,但在很多任务中都展现出了强大性能,被誉为 “代表集成学习技术水平的方法”。Bagging 中基学习器的多样性仅来自样本扰动,而随机深林中基学习器的多样性不仅来自于样本扰动,还来自特征扰动,这就使得最终集成的泛化性能可通过基学习器之间差异度的增加而进一步提升。

http://www.jsqmd.com/news/269975/

相关文章:

  • 【课程设计/毕业设计】基于机器学习python-深度学习CNN-pytorch训练识别蝴蝶-蚂蚱等昆虫
  • AI智能体编写实战AutoGen篇(四)——会干活的导诊 Agent(Planner + Tools 实战)
  • 洛谷 P6419:[COCI 2014/2015 #1] Kamp ← 换根DP
  • 基于人工智能的智能客服系统设计与实现 #计算机毕业设计 毕设 论文 开题报告
  • 基于协同过滤算法的非遗文化交流平台设计与实现 #计算机毕业设计 毕设 论文 开题报告
  • 深度学习毕设项目推荐-基于人工智能python-CNN深度学习识别猫脸
  • 极限科技 Coco AI 荣获 2025 IT168 技术卓越奖 - 创新产品奖
  • 类加载的过程,双亲委派模型以及垃圾回收机制
  • PLC-Recorder如何批量添加曲线?
  • Shader中颜色的加法和乘法的区别
  • 深度学习毕设项目推荐-基于python-CNN卷积神经网络机器学习的柑橘成熟度识别
  • 谈谈我是如何面试技术人员的
  • 自制py功能包解析IMU航迹推算
  • 破解银发学习痛点 兴趣岛 “普惠 + 品质” 模式打造积极老龄化范本
  • flask基于python的在线课程学习平台
  • 肾脏超声图像质量评估与分类系统实现(附Mask R-CNN模型训练)_1
  • 2026人参粉选购指南:从“百草之王”到“品质之选”-神象18年林下山参粉 - 行业调研院
  • java学习笔记1.5
  • flask基于Python的智能购物电商平台商城
  • 深度学习毕设选题推荐:基于python-CNN深度学习识别猫脸
  • java学习笔记1.6
  • 计算机深度学习毕设实战-基于python-CNN深度学习卷神经网络识别猫脸
  • flask基于Python的膳食营养健康系统
  • 编曲伴奏软件有哪些,音乐人分享AI编曲软件助力原创音乐创作
  • 如何高效发布新款,在线看款?
  • flask基于Python的运维管理系统 交换机故障预警处理系统4y5n9i32
  • 深度学习毕设项目:基于python-CNN深度学习识别猫脸
  • 新手必看:渗透测试实战流程 + 工具全攻略(零门槛适配)
  • 深度学习毕设项目:基于python-CNN卷积神经网络的柑橘成熟度识别
  • flask基于大数据的旅游数据分析可视化系统