当前位置: 首页 > news >正文

跟着豆包学AI第三天(Windows版本)内容解析补充

第三天的内容比较多,程序以及配置文件比较杂,故进行这次补充,对配置文件和代码进行相关补充。

1. SSH 免密登录配置

sudo apt install openssh-server -y sudo service ssh start sudo systemctl enable ssh ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys chmod 600 ~/.ssh/authorized_keys chmod 700 ~/.ssh ssh localhost
  • 作用:让start-dfs.sh脚本可以免密码通过 SSH 启动本地的 Hadoop 进程。
  • 关键说明
    • openssh-server:安装 SSH 服务,否则无法接受 SSH 连接。
    • ssh-keygen:生成一对公钥和私钥,用于身份验证。
    • cat id_rsa.pub >> authorized_keys:把公钥加入授权列表,实现免密登录。
    • chmod:修改权限,避免 SSH 因权限过高而拒绝使用密钥。
    • ssh localhost:测试免密登录是否成功。

2. Hadoop 核心配置修改

nano ~/hadoop/etc/hadoop/hadoop-env.sh # 末尾添加 export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
  • 作用:告诉 Hadoop 去哪里找 Java 环境。
  • 关键说明:Hadoop 运行必须依赖 JDK,JAVA_HOME配置错误会导致 NameNode 无法启动。
nano ~/hadoop/etc/hadoop/core-site.xml
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration>
  • 作用:定义 HDFS 的默认文件系统地址,这里指向本地的 9000 端口。
nano ~/hadoop/etc/hadoop/hdfs-site.xml
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
  • 作用:设置数据块的副本数,伪分布式环境下设为 1 即可。

3. 环境变量配置

nano ~/.bashrc # 末尾添加 export HADOOP_HOME=$HOME/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin source ~/.bashrc hadoop version
  • 作用:让系统能在任意路径下找到hadoopstart-dfs.sh等命令。
  • 关键说明source ~/.bashrc让配置立即生效,不用重启终端。

4. HDFS 格式化

hdfs namenode -format
  • 作用:初始化 NameNode 的元数据目录,创建文件系统的命名空间。
  • 重要提醒:这个命令只能执行一次,重复执行会导致数据丢失!

5. 启动与停止 Hadoop

start-dfs.sh start-yarn.sh jps stop-all.sh
  • start-dfs.sh:启动 HDFS 服务(NameNode、DataNode、SecondaryNameNode)。
  • start-yarn.sh:启动 YARN 服务(ResourceManager、NodeManager)。
  • jps:查看 Java 进程,验证 5 个核心进程是否都已启动。
  • stop-all.sh:停止所有 Hadoop 服务。

6. HDFS Web UI:http://localhost:9870

  • 代表什么:HDFS 文件系统的管理界面。
  • 核心作用
    • 浏览文件系统:查看 HDFS 上存储的文件和目录。
    • 监控节点状态:查看 NameNode、DataNode 的运行状态。
    • 查看日志信息:快速定位 HDFS 运行中的问题。
    • 查看数据块信息:了解文件的存储位置和副本情况。

7. YARN Web UI:http://localhost:8088

  • 代表什么:YARN 资源管理器的管理界面。
  • 核心作用
    • 监控集群资源:查看 CPU、内存等资源的使用情况。
    • 管理应用程序:查看正在运行、已完成的 MapReduce/Spark 任务。
    • 查看任务日志:排查任务运行失败的原因。
    • 监控节点状态:查看 NodeManager 的健康状态。

8. 这次操作的完整流程回顾

  1. 安装并配置 SSH,解决了start-dfs.sh的连接拒绝问题。
  2. 配置 Hadoop 的核心文件,定义了文件系统和数据副本规则。
  3. 格式化 HDFS,初始化了文件系统。
  4. 启动 Hadoop 服务,验证了 5 个核心进程都已运行。
  5. 发现并解决了 Hadoop 3.x 端口变更的问题,成功访问了两个 Web UI。
http://www.jsqmd.com/news/888645/

相关文章:

  • 2026年太原市正规上门黄金白银回收品牌门店名录 K金+铂金+金条+银条回收门店联系方式推荐+指南 - 盛世金银回收
  • 2026年昆明市正规上门黄金白银回收品牌门店名录 K金+铂金+金条+银条回收门店联系方式推荐+指南 - 盛世金银回收
  • U-Boot 移植(2)
  • 基于LLM的GitHub App:自动生成Pull Request描述,提升开发效率
  • 文件的类型
  • 2026年娄底市正规上门黄金白银回收品牌门店名录 K金+铂金+金条+银条回收门店联系方式推荐+指南 - 盛世金银回收
  • ESP8266与NeoPixel打造动能光效时钟:从硬件选型到Web控制
  • 2026年来宾市正规上门黄金白银回收品牌门店名录 K金+铂金+金条+银条回收门店联系方式推荐+指南 - 盛世金银回收
  • DCF(现金流折现)估值模型——用Excel计算股票内在价值
  • 3步掌握Python智能体建模:用Mesa框架轻松构建复杂系统仿真
  • 基于以太网与PIC微控制器的模块化智能家居系统DIY指南
  • wifi-densepose部署教程:构建无线感知AI实验环境
  • 秋冬服装越来越难卖?AI或许才是真正突破口
  • 九九八十一难之狡兔三窟,网络共享文件如何用http访问
  • 不管怎么说开始学全栈倒了血霉版CSS篇
  • 2026年兰州市正规上门黄金白银回收品牌门店名录 K金+铂金+金条+银条回收门店联系方式推荐+指南 - 盛世金银回收
  • 射频振荡器深度剖析:从巴克豪森判据到高阶设计考量
  • HybridCLR:Unity全平台C#热更新的原生级完整解决方案
  • 如何解决kafka topic数量过多带来的性能问题?
  • 为RGB数码管设计3D打印外壳:从开源硬件到完整产品
  • Unity不拉伸进度条:RawImage+Mask解耦方案
  • 基于树莓派Pico 2与SiPM的DIY伽马能谱仪:从原理到实践
  • 使用高斯混合模型对鸢尾花数据集进行聚类分析
  • MCP协议入门:构建AI智能体标准化工具扩展的完整指南
  • C#中is运算符的正确用法
  • 2026年淮南市本地上门黄金回收门店指南 彩金+铂金+金条+白银回收门店联系方式推荐 - 大熊猫898989
  • 如何选择适合的光谱仪?专家教你三步选型法
  • AI动态简报之技术前沿篇(2026.05.25)
  • 无损音视频编辑工具 LosslessCut,收获40.3k Star
  • 树莓派零代码实现物理开关机:设备树覆盖与MOS管电路详解