当前位置: 首页 > news >正文

impala参数之‘impala.disableHmsSync‘=‘true‘

参考文章 https://cloud.tencent.com/developer/article/2007738

impala官方文档https://impala.apache.org/docs/build/impala-3.4.pdfhttps://impala.apache.org/docs/build/impala-3.4.pdf

第657-658页

这个参数什么用,顾名思义就是禁止hms数据同步,具体表现是什么呢?为什么要设置呢,该怎么设置呢。一起学习下。

首先我们要了解impala和hive的关系

简单来说impala只是一个数据读取和处理的工具,具体就是读取hdfs表目录下的文件,放到内存里解析(个人理解)。这里存在一个什么问题呢?理论上hive里所有的表和数据都可以通过impala去读取,因为impala基于内存的读取的非常快,但同时页很消耗内存,关键是hive的元数据信息不一定及时同步到impala

1.为什么设置这个参数?

因为不是所有的表都需要通过impala的,大部分是一些结果表,每天更新的一些维表,需要作为报表每天都会有数据更新,这种数据才是真的impala处理的。大部份表其实都不需要,比如你新建了一个test表,只是自己在hive坐下测试,根本不需要通过impala实时查询。但问题的关键就在于这里,impala默认读取所有的表,表的数据越来越多,有时候会读取就会出现问题,所以解决。

直接开测

CREATE DATABASE odsccdata WITH DBPROPERTIES ('impala.disableHmsSync'='true');

desc database extended odsccdata;

CREATE DATABASE cc_test

desc database extended cc_test

建表

create table odsccdata.test1(id int );

create table cc_test.test1(id int );

impala查询

select * from cc_test.test1 -- 直接查看

select * from cc_test.test1 -- 无法查看

invalidate metadata odsccdata.test1 --手动刷新

select * from odsccdata.test1

上面的实验可以看到 如果我们将db设置为disablehmssync之后,所建的表不会被impala采集信息了,需要手动去刷新,这样减少了impala的工作量,肯定能提高效率。

还有的参数可以设置

hms_event_polling_interval_s 设置这个间隔 官方建议设置小于5s

hms_event_polling_interval_s flag set to a positive integer to enable the feature and set the polling
frequency in seconds. We recommend the value to be less than 5 seconds

http://www.jsqmd.com/news/887449/

相关文章:

  • App Inventor蓝牙调试避坑指南:从连接失败到数据乱码,一次讲清所有常见问题
  • 2026年不锈钢水切割加工服务商实测评测:深圳水切割加工厂/瓷砖水切割加工/硅胶水切割加工/绝缘材料水切割加工/选择指南 - 优质品牌商家
  • 从电磁炉到户外电源:拆解单相SVPWM如何让你的逆变器更安静、更高效
  • 基于Arduino与应变片传感器的高精度厨房电子秤DIY全攻略
  • 从‘邮票贴钱’到算法面试:回溯法解连续邮资问题的实战拆解与思路升华
  • 2026年5月口碑好的广东试验箱厂家哪家强厂家推荐榜,恒温恒湿试验箱/高低温试验箱/冷热冲击试验箱厂家选择指南 - 海棠依旧大
  • 基于CH376T模块为电网频率监测仪添加U盘数据记录功能
  • 【CP-05】RTE运行时环境 - SWC的操作系统接口
  • SAP顾问实战:如何用ABAP函数MD_STOCK_REQUIREMENTS_LIST_API批量跑MD04数据(附完整代码)
  • 医药企业加速GSP合规管理的AI自动化路径有哪些?基于AI Agent的全链路自动化实战
  • 空间光调制器(SLM)实战:加权GSW算法如何提升光镊阵列均匀性(附实验对比图)
  • 塔吉克斯坦物流推荐
  • 2026年5月市面上冰箱清洗服务商哪家强厂家推荐榜,直冷/风冷/对开门冰箱清洗选择指南 - 海棠依旧大
  • C语言双端队列完整实现:一行代码吃透头尾操作,算法效率拉满
  • 使用Taotoken CLI工具一键配置开发环境,支持多种AI助手工具
  • 别再傻傻分不清:Mol、SDF、SMILES文件格式到底怎么选?
  • 智能手机相机光谱特性测量与多光谱成像技术
  • 揭秘生物年龄计算:BioAge工具包如何帮你量化衰老进程
  • gr-filter 滤波与多速率模块完整源码分析
  • 在Ubuntu 18.04上搞定Anubis 2.3静态版:从下载、配置到跑通第一个GNSS数据质量分析
  • 高性能Windows流媒体服务器部署:5大核心技术与3种实战架构深度解析
  • modelscope v1.37.1 修复 trust_remote_code 兼容性问题:一次看懂 2026-05-22 最新补丁版全部更新
  • iPaaS 应用场景深度解析:从系统孤岛到数据自由流动的六大实战路径
  • Windows自带的硬盘医生:当移动硬盘提示0x80070570时,除了CHKDSK你还可以试试这些方法
  • i7-10850H 和 T2000 显卡 的 HP ZBook Fury 15 G7
  • 淘金币自动化脚本:5分钟完成所有淘宝任务的终极指南
  • 为什么92%的团队误判DeepSeek生成代码的安全性?——一份被封存的内部质量审计报告(限时公开)
  • 告别录屏软件!用Unity Recorder在编辑器内搞定游戏宣传片(附Timeline联动教程)
  • 拾亩绿光纯亚麻籽微粉哪里靠谱
  • 基于ATtiny85与JQ8900-16P的极简嵌入式音频播放系统设计与实现