当前位置: 首页 > news >正文

【箱线图详解】

文章目录

    • 一. 什么是箱线图
    • 二. 箱线图详解
      • 2.1 下界
      • 2.2 下四分位数(Q1,25%分位数)
      • 2.3 中位数(Q2,50%分位数)
      • 2.4 上四分位数(Q3,75%分位数)
      • 2.5 上界
    • 三. 两个关键概念
      • 3.1 四分位区间(IQR)
      • 3.2 异常值(Outliers)
    • 四. 箱线图在功率预测中的应用
      • 4.1 场景 1:原始功率数据清洗

一. 什么是箱线图

箱线图,顾名思义,就是由“箱子”和“须线”组成的图表,核心作用是用最简单的图形,展示数据的关键统计特征,尤其适合呈现未分组的原始数据分布情况。

二. 箱线图详解

2.1 下界

对应箱线图最下方的须线端点,是排除异常值后,数据集中最小的有效数据点。通常对应 Q1 - 1.5×IQR(IQR为四分位间距),不是整个数据集的绝对最小值,下方须线就是从这个端点延伸至箱体下沿。

2.2 下四分位数(Q1,25%分位数)

对应箱体的下沿(图形中箱体的最下方横线),将数据按升序排列后,位于25%位置的值——也就是说,有25%的数据小于这个值,75%的数据大于这个值,是箱体的“底部边界”。

2.3 中位数(Q2,50%分位数)

对应箱体内部的那条横线,是数据排序后的中间值。如果数据个数是奇数,就是中间那个数;如果是偶数,就是中间两个数的平均值。它比平均值更靠谱,受极端值影响极小,能真实反映数据的“中心水平”,也是图形中最能体现数据集中趋势的部分。

2.4 上四分位数(Q3,75%分位数)

对应箱体的上沿(图形中箱体的最上方横线),位于数据75%位置的值,有75%的数据小于这个值,25%的数据大于这个值,是箱体的“顶部边界”。

2.5 上界

对应箱线图最上方的须线端点,是排除异常值后,数据集中最大的有效数据点。通常对应 Q3 + 1.5×IQR,同样不是整个数据集的绝对最大值,上方须线就是从这个端点延伸至箱体上沿。

三. 两个关键概念

3.1 四分位区间(IQR)

Q3 - Q1,也就是箱体的高度,它代表了数据中间50%的离散程度——箱体越窄,说明这50%的数据越集中;箱体越宽,说明数据波动越大。

3.2 异常值(Outliers)

对应箱线图须线外部的零散圆点或菱形,是超出上界、下界范围的独立数据点。判断标准很简单:小于 Q1 - 1.5×IQR 或大于 Q3 + 1.5×IQR 的数据,都属于异常值,这些数据往往是我们需要重点关注的“特殊情况”,在图形中会单独脱离须线呈现,一眼就能区分。

参考链接:https://www.bilibili.com/video/BV1QuByBBE2i/?spm_id_from=333.337.search-card.all.click&vd_source=cf0b4c9c919d381324e8f3466e714d7a

四. 箱线图在功率预测中的应用

4.1 场景 1:原始功率数据清洗

以「风速区间」为横轴,「风机实际功率」为纵轴绘制箱线图,切入风速 - 额定风速区间内,箱线图须线下方的异常点,对应风速正常但功率异常偏低的限电 / 设备故障数据;超出切出风速后,箱线图须线上方的异常点,对应切出风速下仍有出力的错误数据。

http://www.jsqmd.com/news/616803/

相关文章:

  • 【数据库系统】数据库系统概论——第十五章 内存数据库系统
  • DeepSeek-OCR-2实用指南:如何用AI高效处理扫描件和照片文字
  • 2026年质量好的有钛不粘锅/轻量不粘锅/家用不粘锅/少油烟不粘锅厂家综合对比分析 - 品牌宣传支持者
  • OpenClaw飞书机器人实战:Qwen3.5-9B智能问答系统搭建
  • 企业办公新助手:私有化Qwen3-VL:30B接入飞书实战教程
  • Jimeng LoRA应用案例:快速测试不同Epoch版本,找到最佳训练效果
  • CHORD-X性能调优实战:针对长报告生成的显存与计算优化策略
  • 2026年六角头头部带孔螺栓供应商梯队盘点:六角头螺杆带孔螺栓、带孔紧固件、打孔螺丝、GB31.1、GB32.1选择指南 - 优质品牌商家
  • Dify知识库文件处理链路优化:从上传到检索的稳定闭环方案解析!
  • Qt表格入门(优化篇)陨
  • AI Agent设计:让Pixel Script Temple成为自主创作智能体
  • cv_unet_image-colorization模型训练与微调实战:使用自定义数据集
  • mPLUG部署避坑指南:缓存机制加速,第二次提问秒出结果
  • Git 版本管理下的 Pixel Mind Decoder 模型迭代与部署实践
  • Anomaly Detection系列(CVPR2025 Odd-One-Out论文解读)
  • SAM 3图像视频分割保姆级教程:上传即用,小白秒上手
  • 2026年靠谱的昆山大型龙门加工/昆山龙门铣加工生产厂家推荐 - 品牌宣传支持者
  • Pixel Couplet Gen实操手册:像素春联生成结果导出PNG/SVG格式的前端实现方案
  • MindSpore 环境配置完全指南卤
  • Clawdbot企业集成:飞书机器人深度定制开发
  • 春联生成模型-中文-base实操手册:对接Elasticsearch构建春联语料检索系统
  • Pixel Aurora Engine入门指南:理解‘进化像素’设计哲学与生成逻辑
  • Anko库、AppCompat库
  • 2026年热门的气力输送设备/气力输送泵生产厂家推荐 - 品牌宣传支持者
  • validate.js高级用法揭秘:条件验证、多字段验证与错误处理最佳实践
  • RVC模型Matlab仿真辅助:语音信号处理算法对比验证
  • Hindley-Milner类型签名详解:mostly-adequate-guide-chinese的函数式编程类型系统
  • SDMatte模型微调实战:使用自定义数据集优化特定场景抠图
  • 2026年集装箱售卖亭定制服务商名录:集装箱售楼部/集装箱房屋厂家/集装箱房屋厂家联系电话/集装箱民宿/集装箱酒店/选择指南 - 优质品牌商家
  • Qwen3-ASR-1.7B应用场景:无障碍服务终端接入视障用户语音交互系统