当前位置: 首页 > news >正文

hadoop在linux的安装

在 Linux 系统上安装 Hadoop 需要以下几个步骤:

一、系统环境准备

确保你的 Linux 系统满足以下要求:

Linux 发行版:如 Ubuntu 20.04 LTS、CentOS 7/8、Debian 11 等。Java:Hadoop 需要 Java 8 或更高版本。磁盘空间:至少 20GB(建议 50GB 以上)。网络:确保所有节点之间可以互相通信。

二、安装 Java(推荐 OpenJDK)

sudo apt updatesudo apt install openjdk-8-jdk -y

验证 Java 是否安装成功:

java -versionjavac -version

三、下载 Hadoop 源码

Hadoop 可以从官方下载源码包:

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

解压:

tar -xzvf hadoop-3.3.6.tar.gz

移动到安装目录(如 /opt):

sudo mv hadoop-3.3.6 /opt/hadoop

四、配置 Hadoop 环境变量

编辑 ~/.bashrc~/.profile

nano ~/.bashrc

添加以下内容(根据你的 Hadoop 版本调整路径):

export HADOOP_HOME=/opt/hadoopexport PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

保存并退出,然后执行:

source ~/.bashrc

五、配置 Hadoop 配置文件

Hadoop 配置文件位于 HADOOP_HOME/etc/hadoop/ 目录下。

1. 配置 hadoop-env.sh

nano $HADOOP_HOME/etc/hadoop/hadoop-env.sh

添加以下内容(如需使用 Java 8,确保已安装):

export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64

2. 配置 core-site.xml

nano $HADOOP_HOME/etc/hadoop/core-site.xml

添加以下内容:

<configuration>  <property>    <name>fs.defaultFS</name>    <value>hdfs://localhost:9000</value>  </property></configuration>

3. 配置 hdfs-site.xml

nano $HADOOP_HOME/etc/hadoop/hdfs-site.xml

添加以下内容:

<configuration>  <property>    <name>dfs.replication</name>    <value>3</value>  </property>  <property>    <name>dfs.namenode.http-address</name>    <value>localhost:50070</value>  </property></configuration>

4. 配置 mapred-site.xml

nano $HADOOP_HOME/etc/hadoop/mapred-site.xml

添加以下内容:

<configuration>  <property>    <name>mapreduce.framework.name</name>    <value>yarn</value>  </property></configuration>

5. 配置 yarn-site.xml

nano $HADOOP_HOME/etc/hadoop/yarn-site.xml

添加以下内容:

<configuration>  <property>    <name>yarn.resourcemanager.address</name>    <value>localhost:8030</value>  </property>  <property>    <name>yarn.resourcemanager.scheduler.address</name>    <value>localhost:8031</value>  </property>  <property>    <name>yarn.resourcemanager.webapp.address</name>    <value>localhost:8088</value>  </property></configuration>

六、格式化 HDFS 文件系统

hadoop namenode -format

七、启动 Hadoop

start-dfs.shstart-yarn.sh

八、验证 Hadoop 是否启动成功

jps

你应该看到以下进程:

HadoopNameNodeHadoopDatanodeHadoopSecondaryNameNodeYARN/ResourceManagerYARN/NodeManager

九、可选:使用 YARN 运行 MapReduce 作业

你可以使用以下命令运行一个简单的 MapReduce 作业:

hadoop jar hadoop-examples-3.3.6.jar grep /user/hadoop/input /user/hadoop/output 'cat *'

十、停止 Hadoop

stop-dfs.shstop-yarn.sh

附加说明

如果你使用 Docker,可以使用 docker-compose 来部署 Hadoop。如果你使用 Kubernetes,可以使用 Hadoop 的 Kubernetes 集成。如果你使用 Hadoop 3.x,需要确保你的 Linux 系统支持 Hadoop 3.x。

如需进一步帮助,比如如何运行 Hadoop 的 MapReduce 作业、如何配置集群、如何优化性能等,欢迎继续提问!

文章转自:[《全面攻略!逃离魔力地牢2 ] (https://www.52mwyd.com/news/23414.html)

作者:游戏攻略,转载请注明原文链接:https://www.52mwyd.com/

http://www.jsqmd.com/news/47629/

相关文章:

  • hadoop与mysql的综合应用解决方案
  • hadoop与mysql的数据同步方法
  • 详细介绍:2. 容器常用操作
  • 2025年上海黑臭水体修复服务权威推荐榜单:黑臭水体治理方案/河道水净化公司/河道治理服务商精选
  • 2025年KBK刚性组合式起重机供应商权威推荐榜单:KBK起重机/KBK柔性组合式起重机/KBK刚性吊源头厂家精选
  • 珠海爱尔眼科医院联系方式:常见眼病防治建议
  • 一条SQL的完整执行过程:小明查询员工信息的完整冒险故事
  • LangGraph 官方教程:聊天机器人之三 - 实践
  • 2025年不锈钢管锯片供货厂家权威推荐榜单:切H型钢/角钢切割/切碳素钢锯片源头厂家精选
  • 2025年一体式泵站生产厂家权威推荐榜单:污水一体化泵站/预制泵站/雨水泵站源头厂家精选
  • gzip linux
  • gz文件 linux
  • hadoop for linux 安装
  • 2025年塑胶跑道面层环境测试舱直销厂家权威推荐榜单:塑胶跑道环境舱/2舱塑胶跑道环境舱/4舱塑胶跑道环境舱源头厂家精选
  • selenium: 找到页面上的指定元素并点击
  • 2025年便宜的化工品国际快递企业权威推荐榜单:药品国际快递/粉末国际快递/专线国际快递服务商精选
  • 杂题选做-6
  • 2025.11.22 考试总结
  • 2025年sp防滑路面实力厂家权威推荐榜单:彩色防滑路面/陶瓷颗粒防滑路面/MMA彩色防滑路面源头厂家精选
  • 新赛季临时脱产日记
  • 数据采集第3次作业
  • php openssl, RSA私钥有PKCS#1和PKCS#8,均包含有公钥
  • 2025 年 11 月中空吹塑机厂家推荐排行榜,吹塑机,挤出吹塑机,注射吹塑机,拉伸吹塑机,发泡吹塑机,工具箱吹塑机,瓶子吹塑机公司推荐
  • CF359D-Pair of Numbers
  • 2025.11.18 写题记录
  • F032 材料科学文献知识图谱可视化分析架构(四种知识图谱可视化布局) | vue + flask + echarts + d3.js 建立
  • 2025年AI IDE的深度评测与推荐:从单一功能效率转向生态壁垒 - 教程
  • 2025年AI IDE的深度评测与推荐:从单一功能效率转向生态壁垒 - 教程
  • 2025 最新支架厂家排行榜,出口级品质 + 定制服务 工程采购优选推荐电缆沟/弧形电缆沟/隧道电缆/管廊电力/角钢电缆/热镀锌角钢电缆沟支架厂家
  • vue3 波纹效果