当前位置: 首页 > news >正文

自学笔记——集成学习

文章目录

  • 集成学习
  • 一、bagging
  • 二、boosting
  • 总结

集成学习

bagging和boosting都属于ensemble的范畴,将已有的分类器或者拟合算法通过某种方式组合起来,形成性能更强大的分类器。

典型的bagging:随机森林
典型的boosting:adaboost, GBDT, xgboost

一、bagging

bagging策略:

  1. 在训练集中抽取n个子样本
  2. 在所有属性上,对n个样本作训练,生成1个分类器
  3. 重复上述两步骤m次,并行训练,生成m个分类器
  4. 将数据放在m个分类器上跑,用投票机制决定分到哪一类

bagging的局限性:
由于并行训练,分类器之间相互独立,存在所有分类器都会自同一个区域内获得

随机森林(random forest):

  1. 在训练集中随机抽取n个子样本
  2. 在属性集中随机选择k个属性,构造出一个决策树(CART)
  3. 重复上述两步骤m次,并行生成m个决策树,每颗决策树都最大可能地进行生长而不进行剪枝,多个决策树构成一片森林,决策树之间相互独立
  4. 将数据放在决策树里跑,用投票机制归属分类(默认每颗树权重一致)

RF的优点:
选择训练的样本为子样本,不容易过拟合;
有效的降维方法,在高维数据集处理中,可处理大量输入变量,并输出变量的重要性程度

RF的缺点:
解决回归问题不友好,无法做预测;
像个黑盒子——无法控制模型内部运行,只能在不同参数和随机种子之间做尝试

二、boosting

boosting策略:

串行训练或叫迭代训练弱分类器

  1. 在整个训练数据集上训练模型h1
  2. 对h1表现较差的区域的数据加权,并在这些数据上面训练模型h2
  3. 对h1≠h2的区域的数据加权重,并在这些数据上训练模型h3

boosting的缺点:
由于对噪声数据和异常数据敏感,每次迭代会给噪声点较大的权重;
串行的运行速度慢;

总结

http://www.jsqmd.com/news/610937/

相关文章:

  • 终极鸣潮自动化指南:10个技巧解放双手,一键完成日常任务与声骸刷取
  • 如何使用node-fetch实现GraphQL批量查询:5个减少请求数量的实用技巧
  • 从System.Device.Gpio到AI推理:.NET 9如何让树莓派5跑通Stable Diffusion XL Lite——嵌入式AI新范式
  • 使用adb调试Android技巧
  • CDH在线扩容问题记录
  • COC部落冲突安卓自动搜鱼:Python脚本防封号实战
  • 2026年4月OpenClaw(Clawdbot)如何搭建?京东云快速流程:部署与大模型API、Skill集成指南
  • 从一次Sigar崩溃看Java生态的‘版本地狱’:如何优雅管理JDK与本地库的兼容性矩阵(附jdk1.8.0_241下载与降级实操)
  • 一款基于 .NET 开源、跨平台应用程序自动升级组件露
  • 从Hello World到百万QPS流式AI服务:FastAPI 2.0异步配置黄金5步法,附Grafana监控埋点模板
  • 基于FPGA千兆以太网的开发(1)
  • Sokol动画系统:如何在跨平台C/C++项目中实现流畅的2D与3D动画效果
  • 如何用ok-ww自动化工具彻底解放鸣潮游戏时间:终极保姆级指南
  • ArcGIS Pro/10.x导入JPG/PNG图片颜色失真?三步还原真实色彩(附RGB合成设置详解)
  • 终极指南:如何快速安装 Hollow Knight 模组管理器 Scrab
  • 如何快速掌握大规模移动应用开发:10个核心技巧与最佳实践
  • 如何用IBAnimatable与Swift Concurrency打造流畅异步动画:完整指南
  • 安卓逆向调试必备:5分钟搞定ro.debuggable修改的两种方法(含Magisk重置与模块安装)
  • Git容器化CI/CD终极指南:多阶段构建与缓存策略优化
  • PCA9685 16通道PWM控制器硬件原理与嵌入式驱动实践
  • 基于GEC6818的智能生态缸系统开发实践
  • OpenClaw压力测试:Qwen3-32B在RTX4090D上的持续工作稳定性
  • OpenClaw+千问3.5-35B-A3B-FP8:自动化财务报表生成与分析
  • 华为交换机Netstream隐藏技巧:用VLAN统计实现部门流量精准计费
  • 信创项目实战:手把手教你用达梦DM8+东方通TongWeb在国产OS上部署SpringBoot应用
  • 达梦数据库图形化安装界面常见报错及解决方案
  • 2026年如何集成OpenClaw(Clawdbot)?华为云4分钟新手教程及接入百炼APIKey方法
  • rk3588 适配音频解码芯片 es8388
  • OpenClaw+SecGPT-14B黄金组合:自动化渗透测试报告生成术
  • 如何高效协作开发Fisher插件:团队合作的最佳实践指南