当前位置: 首页 > news >正文

【大数据_数仓架构-DolphinScheduler_一次性讲解清楚如何用DolphinScheduler编排数仓任务】

一、概念逐级对照

┌────────────────────────────┬──────────────────────────────────────────────────────────────────┬─────────────────────────────────────────────┐
│ DS 概念 │ Airflow 对应 │ 说明 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Project 项目 │ ❌ 无原生概念 → 用 dags/ 子目录 + tags + (可选) RBAC Role │ Airflow 所有 DAG 在同一命名空间,靠约定分组 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Workflow 工作流 │ DAG │ 一对一 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Task Node 节点 │ Task(Operator/@task) │ 一对一 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ SUB_PROCESS 子节点 │ TaskGroup(同 DAG 内复用)/ TriggerDagRunOperator(跨 DAG 触发) │ SubDagOperator 已废弃,别用 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ DEPENDENT 节点(跨流依赖) │ ExternalTaskSensor 或 Datasets(数据感知调度,推荐) │ 这是迁移重点 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 全局/项目参数 │ Variables + Jinja 模板({{ ds }} = 业务日期) │ DS 的 $[yyyyMMdd] ≈ {{ ds_nodash }} │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Task Group 并发组 │ Pool(限并发,保护源库) │ │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 租户 Tenant │ Queue + Connection + Worker │ │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 告警/重试 │ DAG/Task 的 retries、on_failure_callback │ 写在代码里 │
└────────────────────────────┴──────────────────────────────────────────────────────────────────┴─────────────────────────────────────────────┘

ODS 接入、DWD/DWS 建模、ADS 分析是不同团队,按层建项目刚好对齐权限;
若同一个团队全包,5 个项目反而增加跨项目 DEPENDENT 的管理成本——这点要结合组织结构

–项目ODS
–工作流 ODS_交易
–工作流 ODS_履约
–工作流 ODS_会员
–项目DIM
–工作流 dim_用户
–工作流 dim_店铺
–工作流 dim_城市
–项目DWD
–工作流 dwd_交易
–工作流 dwd_履约
–工作流 dwd_会员
–项目DWS 【跨域】
–工作流 dws_用户主题
–工作流 dws_店铺主题
–工作流 dws_商品主题
–工作流 dws_履约主题
–项目ADS 【跨主题】
–工作流 ads_经营看板
–工作流 ads_会员运营类
–工作流 ads_商家服务类
–工作流 ads_履约监控类

Airflow:
Airflow 没有 Project,所以"5 个项目"变成目录分层 + 统一 tag/owner:

dags/
├── ods/
│ ├── ods_trade.py # DAG(dag_id=“ods_trade”, tags=[“ods”])
│ ├── ods_fulfillment.py
│ └── ods_member.py
├── dim/
│ ├── dim_user.py
│ ├── dim_shop.py
│ └── dim_city.py
├── dwd/
│ ├── dwd_trade.py # 依赖 ods_trade → ExternalTaskSensor / Dataset
│ ├── dwd_fulfillment.py
│ └── dwd_member.py
├── dws/
│ ├── dws_user.py # 跨域: 等 dwd_trade + dwd_member
│ ├── dws_shop.py
│ ├── dws_item.py
│ └── dws_fulfillment.py
└── ads/
├── ads_ops_board.py # 跨主题: 等多个 dws
├── ads_member_ops.py
├── ads_merchant_svc.py
└── ads_fulfillment_mon.py

"项目"边界 = 目录 + tags=[“dws”] + owner + RBAC(按 tag/folder 配权限角色,对齐 ODS/DWD/ADS 不同团队)。

http://www.jsqmd.com/news/1064314/

相关文章:

  • 实战指南:使用SMUDebugTool解锁AMD Ryzen处理器深度调试与性能优化
  • 解锁二手iPhone激活锁:applera1n免费工具完整使用指南
  • 2026年 宣伟防腐涂料推荐榜单:环氧云铁中间漆/环氧富锌底漆/氟碳漆,高性能与长效防护之选 - 品牌发掘
  • 【毕业设计】面向汽车行业的销售数据可视化系统设计(基于 Django) 基于 Web 的汽车销售数据可视化分析系统(源码+文档+远程调试,全bao定制等)
  • Linux 系统随机熵(entropy)不足
  • 如何用HS2-HF_Patch彻底改造你的Honey Select 2游戏体验?
  • 西安企业做 GEO 优化怎么选服务商?本地 5 家实力派机构实测解析 - GEO优化
  • 别再混淆!AI助手≠数字员工,企业业务人必看的落地避坑
  • 【置顶须知】博主信息与源码获取途径
  • 嵌入式流式协议与智能传感框架:高效数据采集与实时通信实战
  • 粒子生命模拟:用简单规则创造复杂世界的奇妙之旅
  • Mermaid Live Editor:高效智能的实时图表编辑器一站式解决方案
  • c语言用gcc编译过后,执行 ./hello.c 报错 ./hello.c: 权限不够
  • 0.1B参数ProgVLA:轻量VLA模型如何颠覆具身智能范式
  • 3分钟部署FindSomething:重新定义网页信息安全的终极方案
  • ATtiny85超低功耗设计实战:从睡眠模式到系统优化,实现年续航
  • 北京 GEO 服务商 TOP5 评测:高合规要求下的优质服务商甄选 - GEO优化
  • PUBG智能压枪工具终极指南:如何通过图像识别实现精准自动化控制
  • HEIF Utility:让Windows用户轻松处理iPhone照片的实用工具
  • 上海 GEO 服务商 TOP5 汇总:助力品牌抢占 AI 流量的核心服务商解析 - GEO优化
  • FanControl终极指南:5步让你的Windows风扇控制更智能高效
  • 191、影像系统全链路质量评估体系:从 Sensor 原始数据到最终成片的客观指标链
  • Python读取Java Properties文件的正确姿势
  • 嵌入式ROM镜像构建:链接器脚本配置与内存布局实战指南
  • 2026年珠三角GEO优化公司选型深度测评与避坑指南 - GEO优化
  • QLocalServer + QLocalSocket+QProcess
  • USB安全弹出工具终极指南:告别“设备正在使用中“的烦恼
  • 如何免Steam客户端下载创意工坊模组:WorkshopDL完整指南
  • 武汉中央空调维修哪家好?鑫诚制冷、嘉一制冷2026本地口碑榜 - 我叫一
  • Python 版本和项目管理工具 uv 的基本用法