当前位置: 首页 > news >正文

todo - 黑马

一、大数据诞生,概述

数据是一种可以被鉴别的对客观事物进行记录的符号,丰富的数据支撑可以让我们更好地了解事物在现实世界的运行规律,现在是数据的时代,数据非常重要并且蕴含巨大的价值。

大数据的出现,本质就是为了解决海量数据的处理难题,大数据的核心工作就是从海量的高增长,多类别,低信息密度的数据中挖掘出高质量的结果。

大数据使用分布式技术完成海量数据的处理,得到数据背后蕴含的价值。

特征:体积,种类,价值,速度,质量;volume,variety,value,velocity,veracity

Hadoop是一款开源的分布式处理技术栈,提供了

  • 分布式数据存储技术Hadoop HDFS
  • 分布式数据计算技术 Hadoop MapReduce
  • 分布式资源调度技术 Hadoop YARN

Apache Hadoop开源 ---> Apache HBase NoSQL数据库 ---> Apache Flume流式数据传输工具 ---> Apache Kafka分布式消息队列 ---> Apache Hive分布式SQL平台 ---> Apache Spark分布式内存计算 ---> Apache Flink流计算平台 ...

二、大数据的软件生态也是围绕这几点核心工作展开的

  • 数据存储:保存海量待处理数据
  • 数据计算:海量数据的价值挖掘
  • 数据传输:协助各个环节的数据传输

img

img

img

img

img

img

三、Hadoop概述

Hadoop是分布式软件框架,可以部署在1台乃至成千上万台服务器节点上协同工作。内部细分为三个功能组件,分别是HDFS组件,MapReduce组件和YARN组件。

Hadoop有官方社区版(http://hadoop.apache.orrg)和商业发行版,商业发行版有CDH和星环。

以下使用Hadoop3.3.4;

四、分布式存储

数据量变大的时候,单机存储的能力有上限,需要考数量解决问题,多个服务器一起存数据,读写速度,cpu,内存等各方面都会带来成倍的提升

——-——		   ——-——
|文件1| 		|服务器|
|文件2|	--->|服务器|
|文件3| 		|服务器|
——-——		   ——-——

五、分布式的基础架构

大数据体系中,分布式的调度主要有两类架构模式,保证众多服务器一起高效工作:

  • 去中心化
  • 中心化

去中心化众多服务器之间基于特定规则进行同步协调,中心化有一个主服务器进行调度;

大数据框架大多数基础架构上都是符合中心化模式的,有一个中心节点统筹其他服务器的工作,Hadoop就是一个中心化模式架构的技术框架。

六、HDFS的基础架构

HDFS(Hadoop distributed file system)Hadoop分布式文件系统是Hadoop技术栈提供的数据存储解决方案,可以在多台服务器上构建存储集群,存储海量数据。

HDFS集群:

主角色NameNode
主角色辅助角色:SecondaryNameNode
从角色:DataNode

主角色管理HDFS集群和DataNode角色,从角色负责数据的存储,辅助角色协助主角色整理元数据。

	NameNode<------>SecondaryNameNode|		|
DataNode 	DataNode

https://www.bilibili.com/video/BV1WY4y197g7?spm_id_from=333.788.videopod.episodes&vd_source=1a563cd2b3f3fdeb2a16cbbf18022d2f&p=7

https://www.bilibili.com/video/BV1WY4y197g7?spm_id_from=333.788.videopod.episodes&vd_source=1a563cd2b3f3fdeb2a16cbbf18022d2f&p=22

http://www.jsqmd.com/news/72529/

相关文章:

  • 2025年华北海泡石厂家排行榜:海泡石批发厂家与零售商家推荐 - 工业品牌热点
  • JetBrains 公司推出的知名开发工具
  • 樱花燃气灶是一线品牌的产品吗?多维解析其市场地位与产品实力 - 速递信息
  • 磁力反应釜/实验室反应釜/化工反应釜/高压反应釜选购全攻略:加工定制、厂家推荐、口碑解析! - 品牌推荐大师
  • 宝子们!我精心挑选了7家超棒的高压反应釜/夹套玻璃反应釜/双层玻璃反应釜/化工反应釜/实验室反应釜优选厂家,这些厂家不仅用户评价超高,售后服务也超贴心! - 品牌推荐大师
  • 2025年哈尔滨年会创意策划公司排名,看哪家专业可靠? - mypinpai
  • 2025年哈尔滨口碑不错的年会策划品牌企业推荐:看哪家实力强 - myqiye
  • 2025年华北地区石棉绒厂家排名:石棉绒大型厂家推荐 - 工业品牌热点
  • 2025年12月全国温泉评测榜:柯街镇黑温泉引领康养新方向 - 品牌推荐
  • 2025石棉绒优质供应商TOP5权威推荐:助企业避坑降本增竞 - 工业推荐榜
  • 北京最好律师前十排名 2025-2026:性价比与专业实力双维度评价 - 苏木2025
  • 2025年花粉制片机批发厂家推荐榜单:药片制片机‌/试验制片机‌/制片机源头厂家精选 - 品牌推荐官
  • 2025黑龙江交通事故理赔专业律师推荐——服务能力评测报告 - 讯息观点
  • T30 天正结构 V1.0 互联版,下载安装教程结构设计师必备
  • 2025年哈尔滨五大专业的活动策划品牌企业推荐,靠谱的活动策 - myqiye
  • SI2301-ASEMI小型电源适配器核芯组件SI2301
  • 2025哈尔滨信誉好的年会策划专业公司TOP5推荐:有名企业 - mypinpai
  • 实验室反应釜(含磁力、高压类型)加工定制全攻略:选购建议、优质厂家推荐与品牌解析 - 品牌推荐大师
  • 2025年12月太空舱厂家推荐:行业权威盘点与户外旅居舱品质红榜发布​ - 品牌鉴赏师
  • 2025宁夏补牙机构top5推荐!银川/贺兰等地专业补牙服务服务权威榜单发布,技术设备双优守护口腔健康 - 全局中转站
  • AI 学习机:神器还是智商税?一文揭秘,真正懂教育的智能选择! - 品牌测评鉴赏家
  • LangGraph系列:多智能体终极方案,ReAct+MCP工业级供应链高效的系统
  • 2025年淘宝京东拼多多代运营公司Top10实力解析:云麦电商领跑全域增长新赛道 - 深度智识库
  • 高性能表格组件AG Grid 35 全新发布:支持单元格公式、分组拖拽、绝对排序、列选择等
  • 2025年盲孔波纹钢管订制厂家推荐榜单:波纹钢管‌/镀锌波纹钢管‌/镀锌螺旋波纹钢管源头厂家精选 - 品牌推荐官
  • 国标GB28181算法算力平台EasyGBS智慧图书馆视频监控解决方案
  • ctfshowWeb入门Web1
  • 将现有git计划推送到gitcode的方式
  • WPF新手村教程(一) - 走不出新手村别找我
  • 爱森絮凝剂/丙烯酰胺品牌商哪个品牌好哪个性价比高,聚丙烯酰胺型号推荐哪家好 - 品牌推荐大师1