当前位置: 首页 > news >正文

Hadoop 全套常用 Shell 命令完整版

Hadoop 全套常用 Shell 命令完整版,分为 HDFS 文件操作、YARN 任务管理、集群查看、本地启动关闭、常用运维命令,面试、日常开发直接背直接用。

一、HDFS 基础操作命令

1. 查看 HDFS 目录

bash

运行

hdfs dfs -ls / hdfs dfs -ls -R / # 递归查看所有目录

2. 创建文件夹

bash

运行

hdfs dfs -mkdir /test hdfs dfs -mkdir -p /a/b/c # 递归创建多级目录

3. 上传文件(本地 → HDFS)

bash

运行

hdfs dfs -put 本地文件路径 /hdfs路径 hdfs dfs -copyFromLocal 本地文件 /hdfs路径

区别:

  • put:源文件上传后可删除
  • copyFromLocal:源文件保留

4. 下载文件(HDFS → 本地)

bash

运行

hdfs dfs -get /hdfs文件 本地路径 hdfs dfs -copyToLocal /hdfs文件 本地路径

5. 查看文件内容

bash

运行

hdfs dfs -cat /test/file.txt hdfs dfs -tail /test/file.txt # 查看文件末尾

6. 删除文件 / 文件夹

bash

运行

hdfs dfs -rm /test/file.txt hdfs dfs -rm -r /test # 递归删除文件夹 hdfs dfs -rm -rf /test # 强制删除

7. 复制、移动、重命名

bash

运行

# HDFS内部复制 hdfs dfs -cp /a /b # HDFS内部移动/重命名 hdfs dfs -mv /a /b

8. 查看文件大小

bash

运行

hdfs dfs -du -h /

二、Hadoop 集群启动 & 关闭命令

1. 完整集群一键启动(Hadoop2.x/3.x 通用)

bash

运行

start-all.sh

2. 一键关闭集群

bash

运行

stop-all.sh

3. 分开启动(精细版)

bash

运行

# 启动HDFS start-dfs.sh # 启动YARN start-yarn.sh

4. 分开关闭

bash

运行

stop-dfs.sh stop-yarn.sh

5. 查看集群所有进程(jps 必背)

bash

运行

jps

正常完整进程:

  • NameNode
  • DataNode
  • ResourceManager
  • NodeManager
  • SecondaryNameNode

三、YARN 任务管理命令(跑 MR/Spark 任务必备)

1. 查看所有运行中的任务

bash

运行

yarn application -list

2. 根据 applicationId 杀掉任务

bash

运行

yarn application -kill application_xxxxxx

3. 查看任务详细日志

bash

运行

yarn logs -applicationId application_xxxxxx

4. 查看 YARN 集群状态

bash

运行

yarn node -list yarn info

5. 运行自带 MapReduce 测试案例

bash

运行

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar pi 2 5

计算圆周率,用来测试集群是否正常。


四、HDFS 运维常用命令

1. 查看 HDFS 整体状态、使用率

bash

运行

hdfs dfsadmin -report

2. 安全模式相关

bash

运行

# 离开安全模式(HDFS刚启动只读,需要手动退出) hdfs dfsadmin -safemode leave # 进入安全模式 hdfs dfsadmin -safemode enter # 查看安全模式状态 hdfs dfsadmin -safemode get

3. 平衡数据块(DataNode 数据不均衡)

bash

运行

hdfs balancer

4. 检查文件块损坏

bash

运行

hdfs fsck /

五、简写习惯(开发常用缩写)

很多人直接简写:

bash

运行

hadoop fs = hdfs dfs

两者几乎通用,日常敲hdfs dfs更标准。


六、高频面试速记总结

  1. HDFS 特点:一次写入多次读取、不支持随机修改、分块存储、3 副本、高容错
  2. 架构:NameNode (元数据) + DataNode (存数据)
  3. YARN 作用:资源调度,管 CPU 内存
  4. MapReduce 流程:Map → Shuffle 排序分组 → Reduce
  5. jps 五个进程必背
  6. 上传put、下载get、删rm -r、建目录mkdir -p
http://www.jsqmd.com/news/685515/

相关文章:

  • GLM-4-9B-Chat-1M一文详解:开源可部署+单卡可跑+企业级长文本三重价值
  • 如何不依赖AI检测工具,自己识别AI生成内容
  • 系统容灾方案
  • 昇思大模型训练性能优化方案:从瓶颈定位到落地实操
  • 揭秘大模型Steering:从底层机理到系统评估,全面破解大模型行为控制之谜
  • 完整链路内网渗透实战|小白可复现,外网突破直达内网横向
  • 脉冲神经网络开发指南:从原理到医疗影像实战
  • AIOps(智能运维)全解
  • 【收藏备用】2026年版|AI时代“越用AI越吃香”的岗位解析(小白+程序员必看)
  • 卷积神经网络中填充与步长的原理与实践
  • nli-MiniLM2-L6-H768案例展示:英文新闻事件因果链自动构建过程
  • CTF Web 高分秘籍!精讲 SQL 注入 + XSS + 文件上传,搞定一半竞赛基础分值
  • STM32CubeMX + HAL库驱动MG90S舵机:5分钟搞定PWM配置(附避坑指南)
  • 人生单元的庖丁解牛
  • RMBG-2.0抠图工具功能体验:支持蒙版查看,结果一键下载
  • Rust的匹配中的优化编译器表达式布尔
  • Visual C++ Redistributable AIO:Windows运行库的一站式解决方案
  • Janus-Pro模型注意力机制与SSD缓存优化解析
  • 阶段1:容器基础(1–2周)完整深度学习方案【20260422】003篇
  • 2026厂房彩钢瓦翻新哪家好?优选彩钢瓦翻新公司:专业防腐喷漆,厂房屋顶翻新,规模化厂家,匠心施工保长效 - 栗子测评
  • AI-Shoujo HF Patch终极指南:3步快速解锁完整游戏体验与70+模组整合
  • 宁德时代6分钟超充发布-动力电池进入秒充时代
  • 30+输入法词库格式一键互转:深蓝词库转换工具的完整自动化解决方案
  • 从吉尔伯特单元到混频器:一个CMOS差动放大器的‘跨界’实战应用解析
  • 测试右移,也就是生产环境下的QA
  • 2026年3月可靠的石英砂摇摆筛源头厂家推荐,金晨机械引领行业标杆 - 品牌推荐师
  • nli-MiniLM2-L6-H768开源大模型:适配Intel Gaudi2芯片的Habana SynapseAI部署指南
  • 2026广州高龄独居老人护理机构TOP5推荐:越秀悦麓为民护理院、越秀悦麓居养老院、越秀悦麓颐养中心、麓居养老院电话选择指南 - 优质品牌商家
  • 别再到处找模型了!手把手教你从立创EDA专业版导出3D封装,免费给KiCad元件库“添砖加瓦”
  • 从Halcon仿射变换到机械手抓取:手把手教你用vector_to_hom_mat2d完成九点标定与坐标映射(附完整HDevelop代码)