当前位置: 首页 > news >正文

hive3之数据倾斜解决方案

-- 优化方法-- common join
-- 正常关联逻辑-- mapjoin
--- 通过广播小表到内存中进行优化-- bucket map join
-- 通过分桶 广播大表到内存中进行优化-- sort merge bucket map join
-- 通过分桶 成 倍数的关系 进行优化-- 聚合 数据倾斜
--解决方案一:类似于分组聚合 key值分配不均匀,在map端聚合 解决数据倾斜问题
set hive.map.aggr = true; -- 开启map端聚合
set hive.map.agg.hash.min.reduction=0.5; -- 聚合前后条数比较
set hive.groupby.mapaggr.checkinterval=100000;-- 聚合条数-- 方案二:
-- skew-groupby 启用分组聚合数据倾斜优化
set hive.groupby.skewindata = true;
-- 启动两个mr任务,将按照随机数进行发生到reduce 进行聚合 在 发到 第二哥Mr进行 分组聚合-- join表间关联 数据倾斜
--方案一 使用 map join 解决数据倾斜  大表 小表关联 合适场景
--方案二 skew join 为倾斜的 大 key 单独 使用 一个 map 进行 处理  大表和大表关联
-- 处理一对多 数据倾斜
-- 自动检测 大的倾斜 key 自动走 map join 的任务方式进行关联
set hive.optimize.skewjoin = true;
set hive.skewjoin.key = 100000; -- 自动检测 行数超过 10W 就会自动 启动一个 mr 任务处理
-- 方案三 手动调整sql 大表和大表关联 其中有一个表数据 key 倾斜-- 把关联字段 使倾斜的表 对应字段 用子查询 增加 随机 key 进行打散
--  concat(key_col,'_',cast(rand()*n as int)) -- 均匀打撒
-- 对应字段唯一的表,不倾斜的表进行 扩容
--    concat(key_col,'_',1)
--  union all concat(key_col,'_',2)
--  union all concat(key_col,'_',n)

  

http://www.jsqmd.com/news/135608/

相关文章:

  • Java毕设选题推荐:基于springboot的美发商城系统基于springboot美发门店管理系统设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】
  • VFF-Net:一种取代反向传播的AI训练新算法
  • Java计算机毕设之基于Java的停车场管理系统(完整前后端代码+说明文档+LW,调试定制等)
  • Java毕设项目推荐-基于springboot+vue技术的二手车交易管理系统的设计与实现基于SpringBoot的二手车交易平台设计与实现【附源码+文档,调试定制服务】
  • springboot-vue企业会议交换机设备维修批量运维管理系统 vue没论文py09
  • vue基于python的物业维修服务预约平台_g310h596(pycharm django flask)
  • 数据库介绍
  • Dubbo分组(Group)使用指南:建立服务接口的多版本管理与环境隔离
  • Java计算机毕设之基于springBool+Vue美食分享平台的设计与实现基于SpringBoot + Vue的美食网站系统(完整前后端代码+说明文档+LW,调试定制等)
  • 深入解析:Elastic 线下 Meetup 将于 2026 年 1 月 10 号下午在北京举行
  • 2025最新!研究生必备8个AI论文平台:开题报告与文献综述全测评
  • vue基于python的理发店会员管理系统设计与实现_98y5iv88(pycharm django flask)
  • Java毕设项目推荐-基于 Java+Spring Boot 的停车场管理系统基于Java的停车场管理系统【附源码+文档,调试定制服务】
  • 【毕业设计】基于Java的停车场管理系统(源码+文档+远程调试,全bao定制等)
  • 滑动窗口最大值:你以为是数组题,其实是在考“思维是否在线”
  • Java毕设项目:基于springboot的户外救援系统(源码+文档,讲解、调试运行,定制等)
  • 12/24第四章
  • vue基于python的人才招聘系统_y9jyn56q(pycharm django flask)
  • 12.24 - 螺旋矩阵 指针和引用的区别
  • 【课程设计/毕业设计】基于java的智能停车场管理系统基于Java的停车场管理系统【附源码、数据库、万字文档】
  • springboot-vue基于Python可视化的学习做题答题统计系统的设计与实现vue
  • Java毕设项目推荐-基于springBool+Vue美食分享平台的设计与实现基于网络平台的美食分享【附源码+文档,调试定制服务】
  • vue基于python的企业人事绩效考核综合管理系统_z006916a(pycharm django flask)
  • 事后诸葛亮会议报告 - Nyanya-
  • 白嫖党福音:Coze 双旗舰模型限时免费!接入 AIPing 打造你的专属 C++ 后端分析专家
  • springboot-vue基于Python的高校学生成绩分析vue 论文
  • 【毕业设计】基于springboot+vue技术的二手车交易管理系统的设计与实现(源码+文档+远程调试,全bao定制等)
  • 实测!Windows环境下RustFS的安装与避坑指南
  • vue基于python的固定资产转移管理系统设计与实现_qfms7508(pycharm django flask)