当前位置: 首页 > news >正文

【python】pyspark.errors.exceptions.base.PySparkRuntimeError [JAVA_GATEWAY_EXITED] Java gateway proce

pyspark.errors.exceptions.base.PySparkRuntimeError: [JAVA_GATEWAY_EXITED] Java gateway process exited before sending its port number这个错误通常是由于Java,python,spark,pyspark的环境配置问题和版本问题。

版本兼容性

在开始配置环境之前建议检查一下版本。

如果版本不符合上述的话也先按下面流程下来看看能否解决,如果还是不能,则考虑更换版本,以我为例,起初版本为(python3.9,Java17,spark2.4和pyspark3.5),更换(python3.9,Java8即jdk-1.8,spark和pyspark都是3.4.3)版本后环境配置成功。凡事不可一概而论,依照自己本身版本进行更换即可。

Java环境问题

Java建议用Java8(jdk-1.8),在cmd中输入,在使用这个的前提是配置好了JAVA_HOME。

java -version

如果没有配置好的话:此电脑空白处->右键->属性->高级系统设置->高级->环境变量

选择系统变量,新建JAVA_HOME,变量值填Java的安装目录

实在找不到Java的安装目录的话就先在系统变量里面的Path里面新建一个C:WindowsSystem32

这样就可以在cmd中输入

where java

只需要到jdk的根目录就可以了,我的jdk根目录即C:Program FilesJavajdk-1.8

添加完JAVA_HOME后,在Path中添加%JAVA_HOME%in

到此为止,Java的环境就配置好了。

spark环境配置

同理,在下载spark包后将spark解压,建议下载3.x版本。(pip直接安装pyspark问题无法解决,还是直接下载spark包好)

我这个是3.4的下载,下载完后解压后放到合适的文件夹下。

Apache Download Mirrors

同理配置SPARK_HOME环境变量

然后在Path中添加

pyspark环境配置

PYSPARK_PYTHON应该指向Python 解释器的路径。PYSPARK_PYTHON环境变量用于指定 PySpark 应该使用的Python 解释器的路径。这在使用 PySpark 时非常重要,尤其是在有多个 Python 版本或虚拟环境的情况下

用where python得到路径

同时将sparkpython里面的pyspark复制一份到python的libsite-packages中去

这里还是要注意版本问题,spark和pyspark版本建议一样

这里我的spark版本是3.4.3,也对pyspark版本进行改变(原来是3.5)

pip install pysharp==3.4.3

而后再检查一下pyspark版本,正确

随后配置PYSPARK_PYTHON,注意要选择全局安装的python路径

同理如果没有配置python环境的话也可以在path中配置python环境

其实上面两个Java的环境变量语句的作用是一样的,一个是具体的,一个是使用环境变量。很多配置都可以以此类推。

测试

设置好后在cmd中输入代码查看环境配置

echo %SPARK_HOME% echo %PYSPARK_PYTHON% echo %JAVA_HOME%

直接输入

spark-shell

出现这个则配置成功

pyspark

在python中简单测试

from pyspark.sql import SparkSession spark = SparkSession.builder .appName("TestApp") .getOrCreate() data = [("Alice", 1), ("Bob", 2)] df = spark.createDataFrame(data, ["Name", "Id"]) df.show()

输出如下内容则pyspark配置成功

总结

综上所述,安装Java8,再安装合适版本的spark,spark版本和pyspark版本一致更不会出错,配置好JAVA_HOME,SPARK_HOME,PYSPARK_PYTHON。只要环境配置好和版本正确的话就没问题了。

http://www.jsqmd.com/news/454006/

相关文章:

  • [Maui] 造轮子——LoggerSqlite
  • 论文写作必备:专业 AI 软件排名与选择指南
  • 基于DC 12kV、N=12的多电平MMC仿真研究:最近电平逼近调制与排序均压策略实现
  • llc半桥变换器多种控制方式仿真模型:变频、PWM、滞环、自抗扰等控制方式的半桥llc谐振变换...
  • 面对选型困惑与安装难题,如何与可靠的钢格板厂家高效合作? - 企师傅推荐官
  • 中心碰撞优化算法(CCO)-2026年SCI一区新算法-公式原理详解与性能测评 Matlab代码免费获取
  • win11本地部署openclaw实操第9集-配置 OpenClaw 连接本地模型参数
  • 20260309学习 - 小镇
  • QT聊天项目(11)
  • LITESTAR 4D应用:道路附加模块
  • 合规必看|2026西安文审机厂家实力测评,陕西英杰解锁全链条服务 - 朴素的承诺
  • 双碳+24小时分时综合能源系统低碳优化调度:Matlab+Yalmip+Cplex实现综合元素...
  • 玩Prius2004电机设计的兄弟们注意了,这波干货直接上硬菜。手头有套压箱底的实战资料,专治各种电机参数算不准、仿真跑不动、温升控不住的疑难杂症
  • [豪の算法奇妙冒险] 代码随想录算法训练营第五十四天 | 并查集理论基础、Carl107-寻找存在的路径
  • 增强现实(AR)波导器件的MTF分析
  • 好写作AI:从零到一,AI辅助初稿撰写实践——3天憋2000字?不存在的!
  • 自己在Simulink上搭建的四永磁同步电机偏差耦合转速同步控制仿真模型
  • 好写作AI:利用好写作AI快速搭建毕业论文核心章节——别再把时间浪费在“憋”上了
  • 2026年 穿线管厂家推荐排行榜:JDG/KBG/PVC/SC/PE/PPR/玻璃钢穿线管,精选优质品牌助力工程布线! - 品牌企业推荐师(官方)
  • 最近在实验室折腾Matlab的轨迹控制,发现这玩意儿真能玩出花。咱们直接从二维无人机航迹跟踪开整。上回给四旋翼写PID跟踪,核心就这几行
  • 上海美莱去眼袋:精雕眼周焕年轻,口碑见证靠谱医美实力 - 速递信息
  • 【SpringBoot】 解决报错Content type ‘multipartform-data; boundary=...; charset=UTF-8‘ not supported
  • 微电网二次控制,下垂控制,具有DOS攻击的周期微电网二次控制,在电压频率恢复到标称值的同时,实...
  • 2026年最新网易企业邮箱联系电话快速查询指南与购买价格详解 - 品牌2026
  • PAT 乙级 1101
  • 收藏备用|35岁不是危机!写10年CRUD没竞争力?程序员靠AI破局指南
  • 【AI数字人系列】三、数字人——定义数字世界中的你
  • 【递归、搜索与回溯】专题(四):回溯算法综合大练兵(上)—— 子集、排列与组合的进阶
  • 跨境卖家如何应对平台对重复铺货的治理升级
  • WordPress 中的Alt文本与图像标题区别