当前位置: 首页 > news >正文

【大数据_数仓架构-DolphinScheduler_一次性讲解清楚如何用DolphinScheduler编排数仓任务】

一、概念逐级对照

┌────────────────────────────┬──────────────────────────────────────────────────────────────────┬─────────────────────────────────────────────┐
│ DS 概念 │ Airflow 对应 │ 说明 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Project 项目 │ ❌ 无原生概念 → 用 dags/ 子目录 + tags + (可选) RBAC Role │ Airflow 所有 DAG 在同一命名空间,靠约定分组 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Workflow 工作流 │ DAG │ 一对一 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Task Node 节点 │ Task(Operator/@task) │ 一对一 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ SUB_PROCESS 子节点 │ TaskGroup(同 DAG 内复用)/ TriggerDagRunOperator(跨 DAG 触发) │ SubDagOperator 已废弃,别用 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ DEPENDENT 节点(跨流依赖) │ ExternalTaskSensor 或 Datasets(数据感知调度,推荐) │ 这是迁移重点 │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 全局/项目参数 │ Variables + Jinja 模板({{ ds }} = 业务日期) │ DS 的 $[yyyyMMdd] ≈ {{ ds_nodash }} │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ Task Group 并发组 │ Pool(限并发,保护源库) │ │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 租户 Tenant │ Queue + Connection + Worker │ │
├────────────────────────────┼──────────────────────────────────────────────────────────────────┼─────────────────────────────────────────────┤
│ 告警/重试 │ DAG/Task 的 retries、on_failure_callback │ 写在代码里 │
└────────────────────────────┴──────────────────────────────────────────────────────────────────┴─────────────────────────────────────────────┘

ODS 接入、DWD/DWS 建模、ADS 分析是不同团队,按层建项目刚好对齐权限;
若同一个团队全包,5 个项目反而增加跨项目 DEPENDENT 的管理成本——这点要结合组织结构

–项目ODS
–工作流 ODS_交易
–工作流 ODS_履约
–工作流 ODS_会员
–项目DIM
–工作流 dim_用户
–工作流 dim_店铺
–工作流 dim_城市
–项目DWD
–工作流 dwd_交易
–工作流 dwd_履约
–工作流 dwd_会员
–项目DWS 【跨域】
–工作流 dws_用户主题
–工作流 dws_店铺主题
–工作流 dws_商品主题
–工作流 dws_履约主题
–项目ADS 【跨主题】
–工作流 ads_经营看板
–工作流 ads_会员运营类
–工作流 ads_商家服务类
–工作流 ads_履约监控类

Airflow:
Airflow 没有 Project,所以"5 个项目"变成目录分层 + 统一 tag/owner:

dags/
├── ods/
│ ├── ods_trade.py # DAG(dag_id=“ods_trade”, tags=[“ods”])
│ ├── ods_fulfillment.py
│ └── ods_member.py
├── dim/
│ ├── dim_user.py
│ ├── dim_shop.py
│ └── dim_city.py
├── dwd/
│ ├── dwd_trade.py # 依赖 ods_trade → ExternalTaskSensor / Dataset
│ ├── dwd_fulfillment.py
│ └── dwd_member.py
├── dws/
│ ├── dws_user.py # 跨域: 等 dwd_trade + dwd_member
│ ├── dws_shop.py
│ ├── dws_item.py
│ └── dws_fulfillment.py
└── ads/
├── ads_ops_board.py # 跨主题: 等多个 dws
├── ads_member_ops.py
├── ads_merchant_svc.py
└── ads_fulfillment_mon.py

"项目"边界 = 目录 + tags=[“dws”] + owner + RBAC(按 tag/folder 配权限角色,对齐 ODS/DWD/ADS 不同团队)。

http://www.cnnetsun.cn/news/2988763.html

相关文章:

  • FanControl终极指南:5步让你的Windows风扇控制更智能高效
  • 解锁二手iPhone激活锁:applera1n免费工具完整使用指南
  • 工作证明英文翻译怎么办?工作证明英文翻译件办理流程是什么?看完你就明白了!
  • JavaScript :检验数据类型的方法
  • 好用的Windows软件!全局鼠标增强工具!能实现全局鼠标手势、触发角、边缘滚动、窗口拖动与管理等功能!鼠标便捷实用工具
  • 【深度解析】GPT-5.6推理预算升级与复杂Agent代码生成实战
  • 基于NXP P2020DS平台的嵌入式Linux系统开发全流程解析
  • OpenCore Legacy Patcher终极指南:3个简单步骤让老Mac免费升级最新macOS
  • 3.38亿元!3D打印大单背后,无人机发动机开始批量化
  • OpenRGB终极指南:一个免费开源软件统一管理所有RGB设备,告别品牌软件混乱
  • 绝区零自动化终极指南:3分钟上手全自动日常任务解放双手
  • DVWA靶场CSRF攻防实战:从漏洞利用到防御加固
  • 3个步骤掌握Dango-Translator:让外文内容触手可及的实时翻译神器
  • 轻量级音乐理解模型TinyMU:229M参数实现高效音乐推理
  • Path of Building PoE2终极珠宝构建指南:从基础到高级配置全解析
  • Lector:基于Qt的终极开源电子书阅读器完全指南
  • 淘宝运营完整实操指南(新店/老店通用)
  • ER-Save-Editor:让《艾尔登法环》存档管理变得像游戏一样简单
  • Rufus:Windows 11安装神器,轻松绕过TPM限制的终极指南
  • 视频扩散模型加速实战:高效注意力、模型压缩与缓存优化
  • 极简架构设计:减法工程学的五条纪律与落地验证
  • React 项目集成 TypeScript 的工程化实践与避坑指南
  • 实战指南:如何高效使用AI代理开发工具包构建智能应用
  • GTA IV终极修复方案:用FusionFix让你的经典游戏重获新生
  • DSP56720/21 EMC配置实战:GPCM与SDRAM时序详解与调试
  • ATmega406 ADC三大难题:低温失效、共模偏移与参考电压尖峰解决方案
  • 基于大语言模型的自动定理证明辅助系统DAP设计与实现
  • TV Bro:如何用三个核心技术解决智能电视浏览器的交互难题?
  • Obsidian模板库:从信息碎片到知识系统的结构化路径
  • 深入解析NXP Kinetis KE1xF Flash安全机制与核心命令实战