当前位置: 首页 > news >正文

使用 histogram() 进行等宽分桶分布分析

使用 histogram() 进行等宽分桶分布分析

数据分布分析是时间序列工作负载中的关键环节。当你想了解响应时间的分布是否呈长尾、CPU 使用率集中在哪个区间、或者延迟的 99 分位落在哪里时,histogram(field, n) 函数可以直接在数据库内完成等宽分桶,避免将原始数据全量拉到客户端。

等宽直方图的工作原理

histogram(field, buckets) 将字段的值域 [min, max] 均匀划分为 buckets 个等宽区间,然后统计每个区间内有多少条记录。返回结果包含桶的下界(bucket_start)、上界(bucket_end)以及计数(count)。

基本用法

-- 将响应时间分为 10 个等宽桶
SELECThistogram(response_time_ms, 10) AS rt_histogram
FROM api_requests
WHERE ts >= '2025-04-01' AND ts < '2025-04-02';

返回结果样例如下(实际为嵌套表结构):

bucket_start bucket_end count
0.0 150.0 45231
150.0 300.0 18204
300.0 450.0 6732
... ... ...
1350.0 1500.0 43

与时间分桶结合

-- 按小时查看延迟分布
SELECTtime_bucket('1 hour', ts) AS hour,histogram(latency_ms, 5)  AS latency_hist
FROM service_logs
WHERE ts >= NOW() - INTERVAL '24 hours'
GROUP BY hour
ORDER BY hour;

计算每个桶的百分比

-- 计算每个桶的占比
WITH hist AS (SELECThistogram(response_time_ms, 20) AS hFROM api_requestsWHERE ts >= '2025-05-01' AND ts < '2025-06-01'
),
unnested AS (SELECT(h->>'bucket_start')::double AS bucket_start,(h->>'bucket_end')::double   AS bucket_end,(h->>'count')::bigint        AS cntFROM hist, LATERAL UNNEST(hist.h) AS h
)
SELECTbucket_start,bucket_end,cnt,ROUND(100.0 * cnt / SUM(cnt) OVER (), 2) AS pct
FROM unnested
ORDER BY bucket_start;

自定义分桶数量

桶的数量直接影响分析的精细度:

-- 粗略概览:3 个桶
SELECT histogram(temperature, 3) FROM sensor_data
WHERE ts >= '2025-07-01' AND ts < '2025-08-01';-- 精细分析:50 个桶  
SELECT histogram(temperature, 50) FROM sensor_data
WHERE ts >= '2025-07-01' AND ts < '2025-08-01';

适用场景

  • 延迟/响应时间分布分析
  • 传感器数值分布监控(温度、湿度、电压)
  • 计费金额区间统计
  • 数据质量检查(发现异常聚集)

histogram() 让分布分析变得简单直接,无需外部工具即可在 SQL 中完成完整的数据分布洞察。

http://www.jsqmd.com/news/803219/

相关文章:

  • ANNA:为AI编码代理引入架构记忆,告别无效文件探索
  • 2026年全国墙绘公司哪家靠谱 深耕行业多年且质保完善 美院团队加持且服务周到 - 深度智识库
  • 2026南昌婚纱照排名实测版:5大品牌避坑指南,新手备婚不踩雷 - charlieruizvin
  • 【实战】利用AXI DMA Scatter/Gather模式实现FPGA与处理器间高效数据流传输
  • 2026 中小企业 AI 超级员工选型:5 款高适配工具深度测评
  • 3天重构科研工作流:用Obsidian模板实现知识管理的范式转变
  • 中药养发加盟哪家好? - 中媒介
  • 用TI毫米波雷达DIY一个测速仪:从多普勒效应到实际代码(IWR6843实操)
  • Cursor Free VIP:如何一键突破AI编程助手使用限制?
  • LocalVocal:如何在OBS Studio中构建完整的本地AI字幕解决方案
  • 2026室外防爆正压柜标杆名录:防爆正压柜定制/防爆正压柜生产厂家/防爆空调价格/防爆空调生产厂家/防腐防爆正压柜/选择指南 - 优质品牌商家
  • 2026年4月连铸机耐高温轴承生产厂家推荐,不锈钢滚针轴承/滚针轴承/单向轴承,连铸机耐高温轴承生产厂家哪家可靠 - 品牌推荐师
  • 如何挑选省心的动态心电监护仪厂家?2026年五大高可靠心电监护仪厂家推荐 - 品牌2026
  • 养发品牌合作哪家支持多? - 中媒介
  • 3个简单技巧,用OmenSuperHub开源工具彻底解决暗影精灵散热烦恼
  • 告别龟速!用Motrix+Chrome插件下载百度网盘,实测速度翻倍(附插件安装包)
  • 2026年嘉兴制造业短视频全案运营:工厂获客与老板IP打造深度横评 - 企业名录优选推荐
  • 2026活塞推料离心机多少钱:活塞推料离心机哪家好、活塞推料离心机多少钱、浓缩过滤离心机、三足式离心机、卧式刮刀离心机选择指南 - 优质品牌商家
  • 2026年新疆热敏收银纸与电脑打印纸采购完全指南:5大品牌深度横评 - 优质企业观察收录
  • Allegro 16.6铺铜与DRC检查全流程:搞定动态铜、平面分割与设计状态查验
  • 工控人必备:用VMware虚拟机隔离博途V15开发环境,告别系统蓝屏和软件冲突
  • 告别重复劳动:用QEMU在Ubuntu 18.04上为RK3288定制Debian/Ubuntu根文件系统镜像
  • 惠来海康医院眼科母亲节:愿岁月温柔,护她眼底有光
  • 2026年济南婚纱摄影拍摄场景与外景资源评测报告 - charlieruizvin
  • 2026年国内GEO优化公司推荐:十大品牌多维解析智能推广服务格局【5月】 - 资讯焦点
  • AI机器人安全部署:Agent ROS Bridge如何通过影子模式与人在回路保障物理世界安全
  • 手把手教你用Matlab实现DCI-P3到RGB的转换(含整数优化技巧)
  • 2026年新疆复印纸、热敏收银纸等一站式源头直供方案 - 优质企业观察收录
  • PX4开源飞控框架:从响应式设计到模块化实践
  • 减肥用的五谷能量餐哪家效果好? - 中媒介