当前位置: 首页 > news >正文

Hadoop 架构

文章目录

    • 一、概述
      • 1、简介
      • 2、Hadoop 优势
    • 二、架构
      • 1、Hadoop组成
      • 2、HDFS
      • 3、YARN
      • 4、MapReduce
      • 5、HDFS、YARN、MapReduce三者关系
      • 6、大数据技术生态体系

一、概述

1、简介

  • Hadoop是一个由Apache基金会所开发的分布式系统基础架构。
  • 主要解决,海量数据的存储和海量数据的分析计算问题。
  • 广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。

2、Hadoop 优势

  1. 高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。

  2. 高扩展性:在集群间分配任务数据,可方便的扩展数以千计的节点。

  3. 高效性:在MapReduce的思想下,Hadoop是并行工作的,以加快任务处理速度。
    4. 高容错性:能够自动将失败的任务重新分配。

二、架构

1、Hadoop组成

2、HDFS

Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。



  • 1)(nn):就是Master,它是一个主管、管理者。
    • (1)管理HDFS的名称空间;
    • (2)配置副本策略;
    • (3)管理数据块(Block)映射信息;
    • (4)处理客户端读写请求。
  • 2)DataNode:就是Slave。NameNode下达命令,DataNode执行实际的操作。
    • (1)存储实际的数据块;
    • (2)执行数据块的读/写操作。
  • 3)Client:就是客户端。
    • (1)文件切分。文件上传HDFS的时候,Client将文件切分成一个一个的Block,然后进行上传;
    • (2)与NameNode交互,获取文件的位置信息;
    • (3)与DataNode交互,读取或者写入数据;
    • (4)Client提供一些命令来管理HDFS,比如NameNode格式化;
    • (5)Client可以通过一些命令来访问HDFS,比如对HDFS增删查改操作;
  • 4)Secondary NameNode:并非NameNode的热备。当NameNode挂掉的时候,它并不能马上替换NameNode并提供服务。
    • (1)辅助NameNode,分担其工作量,比如定期合并Fsimage和Edits,并推送给NameNode ;
    • (2)在紧急情况下,可辅助恢复NameNode。

3、YARN

Yet Another Resource Negotiator简称YARN ,另一种资源协调者,是Hadoop的资源管理器。

4、MapReduce

MapReduce将计算过程分为两个阶段:Map和Reduce。
(1)Map阶段并行处理输入数据
(2)Reduce阶段对Map阶段的结果进行汇总

5、HDFS、YARN、MapReduce三者关系

6、大数据技术生态体系

http://www.jsqmd.com/news/328095/

相关文章:

  • 布局华中,链接全国|瞬维智能长沙分公司正式成立!
  • 2026年仲裁咨询律师专业评测:谁是你的最优选择?
  • 2026年档案馆智能化服务与管理机器人技术深度解析及主流产品应用
  • 智慧图书馆咨询导览机器人技术深度解析与主流产品评测
  • 第 9 篇:代理模式 (Proxy) —— 硬件的“防火墙”
  • 第 8 篇:适配器模式 (Adapter) —— 换芯片不换代码
  • 【毕业设计】SpringBoot+Vue+MySQL 经方药食两用服务平台平台源码+数据库+论文+部署文档
  • OpenClaw/Moltbot自动进化技巧分享!打造全自动智能超级助手,彻底解放双手,让AI越用越聪明!能自动学习避坑!OpenClaw自动操控Claude Code,全程零干预实现规格驱动开发
  • 企业级经方药食两用服务平台管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • 大学生就业需求分析系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • 2026年临泉县外墙喷砂优质服务商深度评测与推荐
  • Java Web 高校教师电子名片系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】
  • [转]OpenClaw 一周更名两次(原名Clawdbot、Moltbot) ---- 最近爆火的个人智能助理,究竟有什么魅力???
  • 房屋交易平台信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • 企业级青年公寓服务平台管理系统源码|SpringBoot+Vue+MyBatis架构+MySQL数据库【完整版】
  • SpringBoot+Vue 大学生就业需求分析系统平台完整项目源码+SQL脚本+接口文档【Java Web毕设】
  • 基于SpringBoot+Vue的大学生就业需求分析系统管理系统设计与实现【Java+MySQL+MyBatis完整源码】
  • 2026年长沙沙发批发与定制家具优质厂商推荐
  • Python中 .whl 后缀文件的全称
  • Type-C 领夹麦的核心痛点与 PD 协议解决方案
  • PD 协议:高压快充的智能协商过程
  • PD 取电协议:取电从协商到供电的全流程拆解
  • Type-C 一拖二快充线:突破单口限制的技术逻辑
  • UE/C++创建摄像机和弹簧臂组件简单介绍
  • Spring Boot疗养院管理系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】
  • CT断层成像系列00——断层成像的科普入门与基本原理
  • 2026年AI智能产品开发行业十大技术突破与权威认证
  • Java SpringBoot+Vue3+MyBatis Spring Boot企业员工薪酬关系系统系统源码|前后端分离+MySQL数据库
  • 2026年兰州经销商系统公司综合评测与选型指南
  • EASY EAI灵眸科技聚势瑞芯微AI软件生态大会