当前位置: 首页 > news >正文

10分钟极速部署DolphinScheduler:Kubernetes工作流编排的终极指南

10分钟极速部署DolphinScheduler:Kubernetes工作流编排的终极指南

【免费下载链接】dolphinschedulerApache DolphinScheduler is the modern data orchestration platform. Agile to create high performance workflow with low-code项目地址: https://gitcode.com/GitHub_Trending/dol/dolphinscheduler

Apache DolphinScheduler是一款现代化的数据编排平台,通过低代码方式实现高性能工作流的敏捷创建。本文将带你通过Kubernetes环境快速部署这一强大工具,即使是新手也能在10分钟内完成从环境准备到界面访问的全流程。

为什么选择Kubernetes部署DolphinScheduler?

Kubernetes部署模式特别适合需要调度大量任务的生产环境,它能提供卓越的可扩展性和稳定性。相比Standalone模式(适合新手体验)和伪集群部署(适合功能验证),K8s部署具备以下优势:

  • 自动扩缩容能力,应对任务量波动
  • 内置高可用机制,保障服务稳定运行
  • 简化的运维管理,降低集群维护成本

图1:DolphinScheduler支持的多样化任务类型与复杂工作流定义

部署前的准备工作

在开始部署前,请确保你的环境满足以下要求:

  • Kubernetes集群(1.12+版本)
  • Helm工具(3.1.0+版本)
  • 具备PV供应能力的基础设施

如果你还没有安装Helm,可以通过以下命令快速安装:

curl https://raw.githubusercontent.com/helm/helm/main/scripts/get-helm-3 | bash

一键部署DolphinScheduler集群

通过Helm可以实现DolphinScheduler的快速部署,只需执行以下命令:

# 克隆项目仓库 git clone https://gitcode.com/GitHub_Trending/dol/dolphinscheduler # 进入Kubernetes部署目录 cd dolphinscheduler/deploy/kubernetes # 使用Helm安装,替换<version>为实际版本号 helm upgrade --install dolphinscheduler --create-namespace --namespace dolphinscheduler oci://registry-1.docker.io/apache/dolphinscheduler-helm --version <version>

默认配置下,系统会自动部署PostgreSQL数据库(用户root,密码root,数据库dolphinscheduler)和ZooKeeper服务,无需额外配置。

访问DolphinScheduler Web界面

部署完成后,有多种方式可以访问DolphinScheduler的Web界面:

方法1:通过Ingress访问(推荐生产环境)

如果在values.yaml中启用了ingress(ingress.enabled=true),直接通过配置的域名访问:

http://${ingress.host}/dolphinscheduler

方法2:通过端口转发(适合开发测试)

当api.service.type=ClusterIP时,执行端口转发命令:

kubectl port-forward --address 0.0.0.0 svc/dolphinscheduler-api 12345:12345

然后在浏览器中访问:http://localhost:12345/dolphinscheduler/ui

方法3:通过NodePort访问

当api.service.type=NodePort时,执行以下命令获取访问地址:

NODE_IP=$(kubectl get no -n dolphinscheduler -o jsonpath="{.items[0].status.addresses[0].address}") NODE_PORT=$(kubectl get svc dolphinscheduler-api -n dolphinscheduler -o jsonpath="{.spec.ports[0].nodePort}") echo http://$NODE_IP:$NODE_PORT/dolphinscheduler

图2:DolphinScheduler直观的任务状态监控界面

使用默认账号密码登录:

  • 用户名:admin
  • 密码:dolphinscheduler123

验证部署状态

部署完成后,可以通过以下命令检查集群状态:

# 查看命名空间下所有Pod kubectl get pods -n dolphinscheduler # 查看服务状态 kubectl get svc -n dolphinscheduler

所有Pod都处于Running状态表示部署成功。你可以通过查看日志进一步确认服务状态:

# 查看Master节点日志 kubectl logs -f dolphinscheduler-master-0 -n dolphinscheduler # 查看Worker节点日志 kubectl logs -f dolphinscheduler-worker-0 -n dolphinscheduler

基本使用与后续操作

登录系统后,建议参考官方文档的快速上手章节了解基本操作。以下是一些常用的后续操作:

扩缩容集群

根据任务量需求调整集群规模:

# 扩缩容API服务至3个副本 kubectl scale --replicas=3 deploy dolphinscheduler-api -n dolphinscheduler # 扩缩容Worker至6个副本 kubectl scale --replicas=6 sts dolphinscheduler-worker -n dolphinscheduler

启用Worker自动扩缩容(试验性)

通过KEDA实现Worker节点的自动扩缩容,优化资源使用:

# 安装KEDA helm repo add kedacore https://kedacore.github.io/charts helm repo update kubectl create namespace keda helm install keda kedacore/keda --namespace keda --version "v2.0.0" # 启用自动扩缩容 helm upgrade --install dolphinscheduler --namespace dolphinscheduler oci://registry-1.docker.io/apache/dolphinscheduler-helm --version <version> --set worker.keda.enabled=true

卸载DolphinScheduler

如需卸载,执行以下命令:

# 卸载Helm release helm uninstall dolphinscheduler -n dolphinscheduler # 删除PVC(注意:这会删除所有数据) kubectl delete pvc -l app.kubernetes.io/instance=dolphinscheduler -n dolphinscheduler

常见问题解决

端口转发提示socat not found

执行端口转发时如果遇到此错误,需要安装socat:

# Ubuntu/Debian apt-get install socat # CentOS/RHEL yum install socat

如何支持MySQL数据库

默认使用PostgreSQL,如需切换到MySQL,需构建包含MySQL驱动的镜像,具体步骤参见官方文档中的FAQ部分。

如何添加Python3支持

DolphinScheduler默认支持Python2,如需使用Python3,可通过自定义Worker镜像实现:

FROM dolphinscheduler.docker.scarf.sh/apache/dolphinscheduler-worker:<version> RUN apt-get update && \ apt-get install -y --no-install-recommends python3 && \ rm -rf /var/lib/apt/lists/*

总结

通过Kubernetes部署DolphinScheduler,你可以快速拥有一个功能完备、高可用的数据编排平台。无论是处理简单的定时任务,还是构建复杂的依赖工作流,DolphinScheduler都能通过直观的界面和强大的后端能力满足你的需求。

想要深入了解更多高级配置和功能,可以查阅项目的完整文档:部署文档和用户手册。现在就开始探索DolphinScheduler带来的高效工作流编排体验吧!

【免费下载链接】dolphinschedulerApache DolphinScheduler is the modern data orchestration platform. Agile to create high performance workflow with low-code项目地址: https://gitcode.com/GitHub_Trending/dol/dolphinscheduler

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/723104/

相关文章:

  • Twake Drive开发环境搭建:从零开始的完整教程
  • 如何用PyTorch-GAN实现视频预测:从静态图像到动态序列生成的完整指南
  • MCP插件生态为何迟迟无法规模化?深度解析VS Code 1.89+对MCP 2.x的ABI兼容断层,及3种向后兼容迁移路径(含架构对比热力图)
  • SMHasher问题排查:常见错误及其解决方案
  • 从gensim到PyTorch Embedding层:手把手教你将腾讯词向量集成到深度学习模型
  • 从“软件危机”到高效交付:给新手程序员的软件工程避坑指南与实用工具箱
  • FLUX.1-Krea-Extracted-LoRA参数详解:20-30步推理在质量与速度间最佳平衡
  • gltf-pipeline入门教程:5分钟学会glTF与glb格式转换
  • 群晖NAS Realtek USB网卡驱动完整安装与配置指南
  • 防范智能体协作中的三大风险 蚂蚁集团提出全链路安全治理框架
  • 3分钟解锁Cursor Pro永久免费:终极破解工具完全指南
  • 威海贴膜哪家好?2026威海汽车贴膜/太阳膜商家推荐指南 - 栗子测评
  • 百度知道都在用的zepto.fullpage:成功案例解析与最佳实践
  • 从盲签名到群签名:手把手用Python模拟隐私保护签名(附代码避坑指南)
  • VS Code Copilot Next 配置避坑清单:12个高危默认设置+8个被低估的workspace.json隐藏字段(附自动校验脚本)
  • 新概念英语第二册61_Trouble with the Hubble
  • 告别僵硬动画:用mojs曲线编辑器打造丝滑路径动画的终极指南
  • Lowdefy核心概念深度解析:Blocks、Operators、Actions和Requests的终极指南
  • 跨平台基准测试神器:Phoronix Test Suite实战教程
  • 告别单调列表!Bootstrap-Vue列表组件BListGroup的10个高级玩法
  • SDQM:合成数据质量评估的创新方法与实践
  • 固滨笼定制厂家哪家好?2026石笼网箱定制工厂推荐:靠谱的格宾石笼网厂家+推荐格宾网箱定制工厂盘点 - 栗子测评
  • 终极指南:React-Dates主题定制与深度开发实战
  • 2026年广州安保市场调研:广州保安公司、佛山保安公司、深圳保安公司资质服务与口碑全面评估 - 栗子测评
  • 2026年临沂遮阳网厂家哪家好?靠谱遮阳网厂家推荐,遮阳网源头厂家生产实力与产品质量解析 - 栗子测评
  • 2026年成都奢侈品回收TOP5机构 技术维度深度评测 - 优质品牌商家
  • 终极智能导航神器:autojump让终端操作效率翻倍
  • Vinix音频子系统解析:HDA驱动与OSS兼容层的实现原理
  • ArcGIS Python API 空间数据可视化:交互式地图制作教程
  • NVIDIA 发布 Nemotron 3 Nano Omni 模型