当前位置: 首页 > news >正文

Hadoop / YARN / Hive 运维操作教程

Hadoop / YARN / Hive 运维操作教程

本文整理了一份完整的 Hadoop、YARN、Hive 运维操作手册,包括配置同步、集群启动、服务管理、任务监控等常用运维操作。适用于多节点集群的管理和日常维护。


1、Hadoop 配置同步

在多节点集群中,需要保持 Hadoop 配置文件一致,可以通过rsync脚本快速同步。

脚本示例

#!/bin/bash# Hadoop 配置同步脚本# 同步 Hadoop 配置到 node1rsync-avz /usr/local/hadoop-3.3.0/etc/hadoop/ node1:/usr/local/hadoop-3.3.0/etc/hadoop/# 同步 Hadoop 配置到 node2rsync-avz /usr/local/hadoop-3.3.0/etc/hadoop/ node2:/usr/local/hadoop-3.3.0/etc/hadoop/

使用方法

  1. 将脚本保存为/opt/sync-hadoop-config.sh
  2. 添加执行权限:
chmod+x /opt/sync-hadoop-config.sh
  1. 执行脚本进行同步:
sudo/opt/sync-hadoop-config.sh

说明

  • rsync -avz支持增量同步、保持权限并压缩传输。
  • 修改 Hadoop 配置后,必须同步到所有节点,确保集群一致性。

2、Hadoop + Hive 自动启动脚本

快速启动 Hadoop 集群(HDFS + YARN)和 Hive 服务(Metastore + HiveServer2)。

脚本示例

#!/bin/bash# 自动启动 Hadoop 集群及 Hive 服务echo"Stopping any running Hadoop services..."stop-yarn.sh stop-dfs.shecho"Starting HDFS..."start-dfs.shecho"Starting YARN..."start-yarn.shecho"Checking all Java processes..."jpsecho"[12/13] Starting Hive Metastore and HiveServer2..."mkdir-p /var/log$HIVE_HOME/bin/hive --service metastore>/var/log/hive-metastore.log2>&1&disownsleep5$HIVE_HOME/bin/hive --service hiveserver2>/var/log/hiveserver2.log2>&1&disownecho"Waiting for HiveServer2 to start..."while!lsof-i:10000>/dev/null2>&1;dosleep2;doneecho""echo"============================================"echo" Hive Installation Complete!"echo"============================================"echo"Hive CLI: hive"echo"Beeline: beeline → !connect jdbc:hive2://node0:10000"echo"Username: root"echo"Password: 123456"echo"DBeaver: node1 → dbeaver &"echo"============================================"

使用方法

  1. 保存为/opt/start-hadoop-hive.sh
  2. 添加执行权限:
chmod+x /opt/start-hadoop-hive.sh
  1. 执行脚本:
sudo/opt/start-hadoop-hive.sh

说明

  • 脚本会先停止已有 Hadoop 服务,防止端口冲突。
  • 启动顺序为 HDFS → YARN → Hive Metastore → HiveServer2。
  • 脚本会等待 HiveServer2 完成启动(监听端口 10000)。

3、Hadoop 服务管理

停止服务

stop-dfs.sh# 停止 HDFSstop-yarn.sh# 停止 YARN

启动服务

start-dfs.sh# 启动 HDFSstart-yarn.sh# 启动 YARN

查看节点进程

jps# 查看 Hadoop / Java 相关进程

4、YARN 应用管理

查看应用状态

yarnapplication -status<application_id>

示例:

yarnapplication -status application_1762584413435_0004

列出应用

yarnapplication -list# 仅 RUNNINGyarnapplication -list -appStates ALL# 所有状态yarnapplication -list -appStates FINISHEDyarnapplication -list -appStates FAILED

查看容器日志

yarnlogs -applicationId<application_id>

示例:

yarnlogs -applicationId application_1762584413435_0004|grep"Reducer"|grep"container_"

5、Hadoop 节点管理

列出节点

yarnnode-list

查看节点状态

yarnnode-status<node:port>

示例:

yarnnode-status node0:8042yarnnode-status node1:45766

节点标签管理

yarnrmadmin -addToClusterNodeLabels"AMnode"

6、ResourceManager 管理

yarn--daemon stop resourcemanager# 停止 ResourceManageryarn--daemon start resourcemanager# 启动 ResourceManager

7、Hive 操作

hive# 启动 Hive CLIcat/var/log/hiveserver2.log# 查看 HiveServer2 日志

8、系统与集群监控

top# 查看 CPU / 内存使用hdfs dfsadmin -report|egrep"Datanodes|Name|Dead|Live"# HDFS 状态zkServer.sh status# ZooKeeper 状态

9、MapReduce 任务管理

mapred job -list# 列出 MR 任务mapred job -status<job_id># 查看 MR 任务状态

示例:

mapred job -status job_1731089675000_0001

10、常用日志与调试

  • HiveServer2 日志:/var/log/hiveserver2.log
  • Hive Metastore 日志:/var/log/hive-metastore.log
  • YARN 容器日志:yarn logs -applicationId <app_id>
  • HDFS 健康状态:hdfs dfsadmin -report

总结

  • 配置同步脚本:保证多节点 Hadoop 配置一致。
  • 自动启动脚本:快速启动 Hadoop + Hive 集群。
  • 日常运维命令涵盖 Hadoop 服务管理、YARN 应用管理、节点管理、Hive 操作、系统监控和 MapReduce 任务管理。
  • 日志与调试命令:帮助快速定位问题,提升运维效率。
http://www.jsqmd.com/news/267019/

相关文章:

  • VmwareHardenedLoader 虚拟机环境伪装技术深度解析
  • Bongo-Cat-Mver 终极安装配置指南:快速搭建你的Live2D动画助手
  • 计算机毕业设计Django+Vue.js农产品推荐系统 农产品可视化 农产品大数据(源码+文档+PPT+讲解)
  • 2026年评价高的组培瓶洗瓶机厂家推荐 - 优质品牌商家
  • 2026年1月江苏徐州装修、装修设计、装修施工、设计工作室、别墅设计公司推荐:徐州黛雅装饰登顶 - 2026年企业推荐榜
  • PowerJob跨平台部署终极实战手册:从零构建企业级分布式调度系统
  • AI学习 - 诊断结论信息抽取 - LabelStudio 标注 -- 结论标注
  • 从行业痛点切入:时序数据时代的“存储与分析困局“及金仓解决方案
  • 网闸多少钱?附不同规模企业的选型与预算方案 - 飞驰云联
  • 服务不错的吹膜机工厂推荐,瑞安市天晟包装机械有限公司技术怎么样? - 工业品牌热点
  • 2026年知名的混凝土固化,自密实轻质混凝土,水泥发泡混凝土厂家选型参考指南 - 品牌鉴赏师
  • 5个高效清理技巧:彻底解决Windows系统卡顿问题的专业指南
  • 西安装修公司推荐:大品装修以原创设计与高标准工艺领跑商业空间设计 - 深度智识库
  • 2026年必特洗地机推荐:基于多场景实测评价,针对顽固污渍与维护痛点精准指南 - 品牌推荐
  • 《ESP32-S3使用指南—IDF版 V1.6》第六十三章 运动侦测实验
  • 2026年胶囊充填机品牌制造商排行榜,天宏机械实力不容小觑 - 工业品牌热点
  • ysoserial 工具详解
  • 2026成都吉祥雨自助洗车机公司实力口碑榜|加盟优选全解析 - 朴素的承诺
  • ACNH MobileSpawner - 动物森友会实时修改与岛编辑工具
  • 洗地机哪个品牌好?2026年必特洗地机推荐与排名,解决清洁力与便捷性核心痛点 - 品牌推荐
  • 2026年靠谱的四川保温卷帘门厂家最新推荐权威榜 - 朴素的承诺
  • 2026毕业生必看:实测10款降ai率工具红黑榜,论文降ai真的别乱花冤枉钱!
  • 软件信创测试和软件首版次认定机构【使用Postman的Pre-request Script动态处理数据】
  • PHP 变量机制的庖丁解牛
  • 西红柿番茄成熟度识别分割数据集labelme格式783张3类别
  • 零基础PHP程序员“念念不忘,必有回响”的庖丁解牛
  • 2026年必特洗地机推荐:基于多场景实测评价,针对顽固污渍与噪音痛点精准指南 - 品牌推荐
  • 佛山市红亿建材有限公司 联系方式: 企业联系信息查询指引 - 品牌推荐
  • 技术创新 + 国产化标杆!天谋科技荣获金猿大数据产业两项大奖
  • 2026陕西餐饮装修设计哪家强?全省TOP5装修公司推荐,大品装修稳居首位 - 深度智识库