当前位置: 首页 > news >正文

【Hadoop-H D F S读写流程】

如上图所示,

hdfs的读写流程

明确hdfe分布式系统的优势:①存储量大;②安全性高(有备份,一般是3个备份);③高容错性:不怕机器坏,数据不会丢,任务不用从头跑。

因此,windows 的数据文件首先通过 Linux 管理系统平台 传递给在linux虚拟机上部署的node1上的Namenode,Namenode将数据进行调度(分配),将传入的数据分配给node1上的Datenode,node1上的Datenode将数据的备份传给node2,node2上的Datenode再将数据的备份传给node3,node3上的数据传输好以后,node3上的Datenode会返回部署完成的指令给node1上的Namenode,最后无报错即运行成功。

注:①windows上的文件可以直接从本地添加到hdfs,如果要写进去,需要再装载Linux 管理系统平台 通过此平台进行写入;

------hadoop核心系统的主要功能和流程

② Linux 虚拟机上的文件要用hadoop的读写语句写入到hdfs中,即 Linux 上的文件和 Linux 上装的hadoop是处于隔绝的状态,hadoop中的运算程序MapReduce,它只能计算存放在HDFS上的数据,因此,我们必须将Linux上的文件fs -put 进hadoop中去。

③Mapreuce 程序运行需要资源,所以必须开启 Yarn 集群。

④综上所述,hadoop核心系统的流程是数据最先进入hdfs系统,再开启Yarn集群,再进行MapReduce运算。

HDFS 常用命令集合

1.启动命令

start-dfs.sh

可以启动hadoop

2.cmd = 要执行的核心子命令

Hadoop fs -cmd <args>

cmd:fs ,fs是核心子命令,前面不需要加 ‘-’,核心子命令后面要加参数

3.列出可以运行的命令

hadoop fs

即不添加任务具体的执行命令,Hadoop 就会列出命令行接口的帮助信息,如下所示:

[root@node01 ~]# hadoop fs Usage: hadoop fs [generic options] [-appendToFile <localsrc> ... <dst>] [-cat [-ignoreCrc] <src> ...] [-checksum <src> ...] [-chgrp [-R] GROUP PATH...] [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...] [-chown [-R] [OWNER][:[GROUP]] PATH...] [-copyFromLocal [-f] [-p] [-l] <localsrc> ... <dst>] [-copyToLocal [-p] [-ignoreCrc] [-crc] <src> ... <localdst>] [-count [-q] [-h] [-v] [-x] <path> ...] [-cp [-f] [-p | -p[topax]] <src> ... <dst>] [-createSnapshot <snapshotDir> [<snapshotName>]] [-deleteSnapshot <snapshotDir> <snapshotName>] [-df [-h] [<path> ...]] [-du [-s] [-h] [-x] <path> ...] [-expunge] [-find <path> ... <expression> ...] [-get [-p] [-ignoreCrc] [-crc] <src> ... <localdst>] [-getfacl [-R] <path>] [-getfattr [-R] {-n name | -d} [-e en] <path>] [-getmerge [-nl] <src> <localdst>] [-help [cmd ...]] [-ls [-C] [-d] [-h] [-q] [-R] [-t] [-S] [-r] [-u] [<path> ...]] [-mkdir [-p] <path> ...] [-moveFromLocal <localsrc> ... <dst>] [-moveToLocal <src> <localdst>] [-mv <src> ... <dst>] [-put [-f] [-p] [-l] <localsrc> ... <dst>] [-renameSnapshot <snapshotDir> <oldName> <newName>] [-rm [-f] [-r|-R] [-skipTrash] <src> ...] [-rmdir [--ignore-fail-on-non-empty] <dir> ...] [-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]] [-setfattr {-n name [-v value] | -x name} <path>] [-setrep [-R] [-w] <rep> <path> ...] [-stat [format] <path> ...] [-tail [-f] <file>] [-test -[defsz] <path>] [-text [-ignoreCrc] <src> ...] [-touchz <path> ...] [-usage [cmd ...]] Generic options supported are -conf <configuration file> specify an application configuration file -D <property=value> use value for given property -fs <local|namenode:port> specify a namenode -jt <local|resourcemanager:port> specify a ResourceManager -files <comma separated list of files> specify comma separated files to be copied to the map reduce cluster -libjars <comma separated list of jars> specify comma separated jar files to include in the classpath. -archives <comma separated list of archives> specify comma separated archives to be unarchived on the compute machines. The general command line syntax is bin/hadoop command [genericOptions] [commandOptions]

4.-appendToFile

将服务器本地的文件追加到HDFS指定的文件中,如果多次运行相同的参数,则会在 HDFS 的文件中追加多行相同的内容。实例代码如下所示:

hadoop fs -appendToFile data.txt /data/data.txt

5.-cat

主要用来查看 HDFS 中的非压缩文件的内容。实例代码如下所示:

[root@node01 ~]# hadoop fs -cat /data/data.txt hello hadoop hello hadoop

6.续

干货 | HDFS常用的40个命令,你都知道吗?-腾讯云开发者社区-腾讯云

Hadoop 集群常用端口

①HDFS 集群web访问端口: 9870

②HDFS 操作端口 : 8020

③YARN 集群资源端口: 8088

④Yarn 历史服务器的端口: 19888

http://www.jsqmd.com/news/1100163/

相关文章:

  • CTF实战:手把手教你用Python脚本秒解BUUCTF那道RSA共模攻击题(附完整代码)
  • cubemx生成的Lwip问题解决方法,文件丢失?死活ping不通?(dp83848)
  • # PE防锈袋材质成分与选型逻辑解析
  • Ghost Downloader:AI 加持的跨平台多线程下载器
  • 为AI Agent配置专属邮箱:从数字身份到A2A通信的工程实践
  • Excel 客户跟进表怎么设计:字段、阶段、看板和今日待办
  • 经营管理赋能:被低估的孵化器核心竞争力
  • python里与spark相关的语法介绍
  • 如何保护您的 Reddit 账户:2026 年全方位安全运行Reddit账户
  • 什么是酒吧大屏互动系统?软硬件、功能模块、营收能力一文详解
  • 通俗易懂!三种解法彻底吃透【轮转数组】(LeetCode189)
  • 2026物理AI元年已至,自动驾驶企业该重概念还是重落地?
  • Linux基础常用命令实操指南
  • 快上车!掌握多尺度Mamba新方法,快人一步发文章
  • 监控与可观察性开源平台 Grafana 13.0.3 发布,多项特性增强与 Bug 修复!
  • PC+移动端双端测试:功能、兼容、一致性+排期
  • 智慧校园技术改造实战:智能锁身份核验+通断电联动,解决校园安全与运维痛点
  • 2026国产AI写歌工具横评 商用合规与效果实测
  • 加密数据分析实战:从识别到解密的系统性方法
  • 3个ComfyUI中文工作流常见问题及解决方案:从困惑到精通
  • 从亚麻布到汽车音响:为什么喇叭音盆材料会影响声音?
  • 圆满收官|VeryCloud亮相2026亚马逊云科技中国峰会,AI实践获行业积极反馈
  • TokUI:面向AI场景的流式UI框架
  • 卡尔曼滤波在桥区船舶航行轨迹预判中的工程落地实践
  • 从文本 Agent 到具身 Agent:一场关于数字人认知的底层重构
  • 本地 AI 自动化工具 OpenClaw 部署全流程,附常见故障修复(含安装包)
  • 大众点评数据2026
  • AI Agent 实战部署指南:从核心能力到接口测试的完整流程
  • 翻译毕业证需提供哪些材料?翻译毕业证如何办理?
  • 接纳孩子的平凡,是父母最高级的通透