当前位置: 首页 > news >正文

doris中的分区上卷

在 Doris 中,分区上卷(Roll-Up)是一种优化存储和查询性能的重要机制,其核心是通过合并细粒度分区(如日分区)为粗粒度分区(如月分区或年分区),减少分区数量并提升查询效率。

当基表数据经过聚合处理后,各分区的数据量可能会显著减少。在这种情况下,可以采用分区上卷策略,以降低物化视图的分区数量。


1. 分区上卷的原理

假设原始表按天分区:

CREATE TABLE sales ( event_day DATE, product_id INT, revenue DECIMAL(10, 2) ) PARTITION BY RANGE(event_day) ( PARTITION p20230101 VALUES [('2023-01-01'), ('2023-01-02')), PARTITION p20230102 VALUES [('2023-01-02'), ('2023-01-03')), ... );

通过分区上卷,可将多个日分区合并为月分区:

ALTER TABLE sales ROLLUP (PARTITION p202301 TO p202301);

2. 操作步骤

2.1 启用分区上卷

在表创建时定义上卷策略:

CREATE TABLE sales ( ... ) PARTITION BY RANGE(event_day) ROLLUP ( TO YEAR(event_day), -- 按年上卷 TO MONTH(event_day) -- 按月上卷 );
2.2 手动触发上卷
ALTER TABLE sales ROLLUP PARTITION p20230101, p20230102 TO PARTITION p202301;

3. 使用场景

  • 存储优化:合并旧分区减少小文件数量,降低存储开销。
  • 查询加速:查询月数据时直接访问月分区,避免扫描多个日分区。
  • 自动化管理:结合调度工具定期执行上卷操作。

4. 注意事项

  • 不可逆性:上卷后原分区数据不可恢复,需提前备份。
  • 权限要求:需ALTER权限执行上卷操作。
  • 性能影响:上卷过程可能暂时占用系统资源,建议低峰期执行。

5. 示例代码

# 模拟按月自动上卷的调度逻辑 import schedule import doris_client def monthly_rollup(): last_month = "2023-12" # 合并上个月的所有日分区 doris_client.execute( f"ALTER TABLE sales ROLLUP PARTITION p{last_month}01 TO p{last_month}31 TO PARTITION p{last_month};" ) schedule.every().month.do(monthly_rollup)

通过合理使用分区上卷,可显著提升 Doris 在大数据场景下的存储与查询效率。

http://www.jsqmd.com/news/139413/

相关文章:

  • 工商注册服务推荐:选对公司,开启企业省心之旅
  • doris中的Broadcast Join
  • 工商注册服务哪家好?靠谱之选看这里
  • 某机构趁低买入以太坊,持仓超300万枚
  • 2025年好吃的重庆香肠品牌排行,满足不同场合和个人喜好需求 - 讯息观点
  • 启用Qoder编写ztdaq的C#跨专业的平台示例总结
  • ProfiNet转CAN网关优质生产商推荐
  • 2025最新!继续教育必备9个AI论文平台深度测评
  • doris的Bucket Shuffle Join
  • 8个AI论文软件推荐,继续教育学生轻松搞定毕业论文!
  • 2026设计师私藏,正版高清图片素材网站,商用无风险,购买超省心 - 品牌2026
  • 2025年推荐电池厂排行榜,新测评精选电池正规厂商与电池生产企业推荐
  • XZ Utils库后门漏洞深度剖析:CVE-2024-3094的RCE风险与缓解方案
  • 微信小程序vue_uniapp二手书交易平台
  • 全网热议!2025年热门空调安装品牌推荐,助您选择优质的合作伙伴 - 讯息观点
  • 会议精灵:用ModelEngine构建智能办公助手实战记录
  • Doris的Colocation[托管] Join
  • 2026全网精选,商用高清正版图片素材网站合集,无版权风险放心用 - 品牌2026
  • Spring Boot 与 Apache POI 实现复杂嵌套结构 Excel 导出
  • 3453453
  • 【无人机】带飞行约束的MPC无人机【含Matlab源码 14779期】
  • 企业AI数据训练如何选?图片、视频素材与数据集供应商的选择策略 - 品牌2026
  • ProfiNet 转 CAN 网关:品牌、选购与塔讯技术推荐
  • HR追着要的面试分析Agent!全网首发华为ModelEngine实战
  • 电池定制与服务:优质供应商的选择攻略
  • 微信小程序vue_uniapp动漫国漫交流系统动漫视频评论
  • 微信小程序uniapp-vue精品课程在线学习平台
  • 完整教程:Lyra学习001:从0开始学习 **Lyra Starter Game** 项目
  • zz MCP (Model Context Protocol),一篇就够了。
  • MYSQL随记