当前位置: 首页 > news >正文

实用指南:Hadoop High Availability 简介

目录

引入HA

针对HDFS的高可用

核心组件

故障转移流程

针对YARN的高可用

核心组件

故障转移流程


引入HA

在早期的Hadoop版本中,核心组件存在单点故障问题:

唯一的主节点,存储了整个文件系统的元内容。如果它宕机,那么整个HDFS将不可用。就是HDFS:NameNode

YARN:ResourceManager是唯一的全局资源调度器。如果它宕机,所有新的作业无法提交,正在运行中的作业也可能失败。

为了解决单点故障问题,就需要部署备用主节点,来确保集群在主节点发生故障时能够快速恢复,对外提供不间断的服务,这正是高可用的目的。所谓高可用,是为解决单点故障设计的架构方案。

针对HDFS的高可用

HDFS HA通过设置Active-Standby(主-备)两个NameNode来实现高可用,其中主要通过QJM方式来实现状态同步。

核心组件

Active NameNode:对外提供服务的主节点,处理客户端的请求。

Standby NameNode:热备份节点。它的状态必须与Active NameNode实时同步,以便在发生故障时能够无缝衔接。

JournalNode:通常3个活以上奇数个来组成共享存储系统。所有对namespace的修改,Active NN都会先将操作日志(editslog)写入共享存储,然后Standby NN持续地从其中读取并应用这些日志。
DataNode:所有DataNode利用心跳机制向Active NN和Standby NN发送心跳和块报告,于是数据块存储在哪个DN上不应该同步到共享存储中。

ZKFC(Zookeeper Failover Controller):一个运行在每个NN节点上的独立进程,用于监控NN的健康状态并管理故障转移。

故障转移流程

①Active NN的ZKFC检测到Active节点无响应,尝试在zookeeper中删除该临时节点;

②Standby NN的ZKFC监控到这个节点消失,立即尝试创建该节点以宣告自己为新的Active;

③创建成功后,Standby NN的ZKFC会执行一个fence(隔离)命令,强制杀死原Active进程,防止出现脑裂;

④新Active NN从JournalNode中读取编辑日志,并开始接收DN的心跳和块报告;

⑤客户端借助重试机制自动连接新Active,业务无感知。

针对YARN的高可用

YARN HA 的原理与 HDFS HA 非常相似,也是基于 Active-Standby 模式和 ZooKeeper 的自动故障转移。

核心组件

Active ResourceManager:处理所有客户端的请求,管理整个集群的资源。

Standby ResourceManager:热备份节点,随时准备接管。

状态存储:将RM的状态持久化(状态信息)存储在zookeeper中或HDFS文件。

ZooKeeper:用于领导选举和存储YARN集群的状态。多个RM通过竞争,一个成为Active,其余成为Standby

故障转移流程

①zookeeper检测到Active ResourceManager故障,相关临时节点被删除;

②所有Standby ResourceManager监测到这一变化,开始新一轮的选举;

③其中一个Standby RM成功在zookeeper创建了代表Active状态的临时节点,成为新的Active RM;

④新的Active RM从状态存储(ZK或HDFS)中重演出故障前的集群状态;

⑤所有NM会通过心跳机制发现Active RM变更,向新王重新注册;所有运行在container的applicationmaster也会重新注册并汇报任务状态,不受影响。

http://www.jsqmd.com/news/50767/

相关文章:

  • 蓝牙协议:ant/ant+
  • 题解:CF1746D Paths on the Tree
  • 完整教程:CodeBuddy+混元生图+lighthouse助我实现漫画插图在线生成
  • 人工智能之数据分析 numpy:第十四章 知识总结
  • 信息的建筑学:MyBatis Log Panda 如何重构开发者的认知地图
  • 皮革外观缺陷检测设备:助力生产质量把控的技术应用
  • 2025年最新!高效AI论文写作工具TOP 3 权威评测
  • 解决Windows窗口在屏幕外的问题
  • 2025水设备厂家推荐榜:灌装/大桶/桶装/纯净/瓶装/水设备综合品牌参考,引领智能绿色升级
  • 降ai率工具推荐:提升文本原创性的实用选择
  • 【2025最新】Claude Opus 4.5最全使用教程:新手一篇文章完全搞懂
  • ai论文软件推荐:智能工具助力学术写作效率提升
  • AI论文写作辅助工具推荐:提升学术创作效率的实用平台
  • ai论文工具推荐:助力学术创作效率提升的实用工具
  • 2025年11月软瓷厂家推荐榜:3D软瓷/软瓷砖/mcm软瓷/3D打印软瓷厂家批发环保品质深度解析!
  • 降ai率免费网站:助力内容原创性提升的实用工具
  • 2025年11月钢管源头厂家 TOP 榜:螺旋/防腐/镀锌/直缝焊接钢管源头厂家详解精密工艺与重点工程供货实力!
  • 2025年国际发表必备!多语言AI论文写作工具TOP 3 深度测评
  • 2025年11月汽车维修工厂推荐榜:汽车数据修复/汽车凹陷修复工厂推荐技术实力与车主口碑深度解析!
  • 外观检测设备有哪些?制造业主流方案及应用解析
  • PVC地板厂家天津航美国际贸易有限公司:华北平价基地核心成员,规模化降本,耐磨防滑产品适配多场景
  • 光学膜外观缺陷检测设备:技术创新与行业应用动态
  • PVC地板厂家天津航美:2016年成立深耕行业,同质透心/地板革等全品类,防火阻燃符合国际标准
  • 云拨测:当“正常变更”摧毁全球网络时,谁来守护你的业务可用性?
  • 江苏省民间借贷纠纷律所推荐:专业法律服务机构盘点
  • AOI检测设备定制厂家:聚焦高精度检测方案的行业实践
  • 钙钛矿外观缺陷检测设备:技术应用与行业发展
  • 推荐几家灵芝品牌,这些优质选择值得了解
  • 睡眠不好吃的益生菌选哪家好?热门产品解析
  • 江苏省刑事律所推荐:专业法律服务机构参考