当前位置: 首页 > news >正文

Pentaho 和他的五位成员(五灵威力) kettle spoon pancarte kitchen (pdi的前生今世)

Pentaho是个合成词

Penta是希腊数字 “五”的前缀

ho是夏威夷文化词语发音氛围,

pdi的(Pentaho Data Intergation)软件的作者是个夏威夷文化推崇者,作者希望借用

五种灵力,和五种构成世界的五种元素来代表,数据就像是信息世界的各种由五种基本元素组成的物质一样,需要精心爱护,夏威夷文化中的语言氛围前缀 "ho"

地球

空气

精神

等五种灵力来构建一个文明的完美的系统Pentaho 由此诞生

Pentaho Kettle 是一个强大的 ETL(Extract, Transform, Load)工具,其主要组件包括 Spoon、Pan、Kitchen 和 Carte,它们之间的关系如下:

Spoon (勺子)(从数据湖中取出一勺水)pentaho世界的五灵之一

  • 作用:Spoon 是 Kettle 的图形化用户界面工具,用于设计和编辑 ETL 作业(Job)和转换(Transformation)。用户可以通过拖拽组件的方式构建数据流。

  • 与其他组件的关系:Spoon 设计好的作业和转换文件分别保存为.kjb.ktr格式,这些文件可以被 Pan 和 Kitchen 执行。

Pan (平底锅) (容量比勺子大从数据湖中可捞一锅水)pentaho世界的五灵之一

  • 作用:Pan 是一个命令行工具,用于执行由 Spoon 设计的转换文件(.ktr)。它适合在服务器环境中运行,支持批处理和自动化任务。

  • 与其他组件的关系:Pan 从 Spoon 设计的.ktr文件中读取转换定义,并执行相应的数据处理任务。

Kitchen(厨房,厨师)(自行大作业编排,像厨师烹饪一样)pentaho世界的五灵之一

  • 作用:Kitchen 是一个命令行工具,用于执行由 Spoon 设计的作业文件(.kjb)。作业通常包含多个转换和其他控制流程,如条件判断、循环等。

  • 与其他组件的关系:Kitchen 从 Spoon 设计的.kjb文件中读取作业定义,并按照作业的流程执行多个转换。

Carte (菜单,菜单卡)(显示与调度)pentaho世界的五灵之一

  • 作用:Carte 是一个轻量级的 Web 服务器,用于远程执行和监控由 Spoon 设计的转换和作业。它支持分布式执行,可以在多台服务器上并行处理任务,提高处理效率。

  • 与其他组件的关系:Carte 可以接收远程请求,执行 Spoon 设计的转换和作业,并提供 Web 界面用于监控任务的执行状态。

  • kettle就是大水壶 是pentaho世界的五灵之一

其实数据湖的概念就是由pentaho这个公司提出的

总结

  • Spoon是设计工具,用于创建和编辑.ktr.kjb文件。

  • PanKitchen是执行工具,分别用于执行.ktr.kjb文件。

  • Carte是分布式服务器,用于远程执行和监控转换和作业。

这些组件共同构成了 Kettle 的完整 ETL 解决方案,支持从设计、开发到执行和监控的全流程数据处理

pdi和kettle的关系呢

PDI(Pentaho Data Integration)和 Kettle 实际上是同一个工具,只是名称不同。它们之间的关系可以总结为:PDI 是 Kettle 的正式名称,而 Kettle 是其社区版的名称。

背景

  • Kettle:最初是一个开源的 ETL(Extract, Transform, Load)工具,由 Matt Casters 开发,并在 2006 年左右被 Pentaho 收购。

  • PDI:在 Pentaho 收购 Kettle 后,将其整合到 Pentaho 的商业智能平台中,并正式命名为Pentaho Data Integration(PDI)。这个名字更符合其在 Pentaho 生态系统中的定位。

功能和用途

无论是 Kettle 还是 PDI,它们的核心功能和用途是相同的:

  1. 数据提取(Extract):从各种数据源(如数据库、文件、API 等)中提取数据。

  2. 数据转换(Transform):对数据进行清洗、转换、聚合等操作。

  3. 数据加载(Load):将处理后的数据加载到目标数据仓库或数据库中。

版本差异

  • 社区版(Kettle):完全开源,由社区维护和开发,适用于个人开发者和小型项目。

  • 企业版(PDI):包含在 Pentaho 的商业产品中,提供额外的企业级功能,如更好的性能优化、高级调度、安全性和支持服务。

总结

PDI 和 Kettle 是同一个工具的不同名称:

  • Kettle是社区版的名称,主要用于开源社区的开发和使用。

  • PDI是 Pentaho Data Integration 的缩写,是 Pentaho 官方的正式名称,适用于企业级应用。

两者在功能上完全一致,只是在使用场景和目标用户群体上有所不同。

http://www.jsqmd.com/news/290258/

相关文章:

  • javafx程序启动cmd.exe调用其他软件或者脚本指令
  • 如何解决 Spoon 与 Carte 互联的 UTF-8 编码问题
  • spoon如何连接carte如何将.ktr任务或者.kjb任务提交个远程carte服务让,carte的服务端来执行 etl脚本的任务呢?
  • Pentaho Data Integration:Spoon与Carte的对比
  • mast3r-smf测试 - MKT
  • 备份 还原 系统 数据保护
  • 中小厂 AI 招聘隐藏要求:除了技术,这 2 点更关键
  • nodejs基于vue的教学质量评价管理系统的设计与实现 评教系统39j06
  • 二叉树递归实现
  • nodejs基于vue的教师科研项目申报信息管理系统的设计与实现_c7z6m
  • nodejs基于vue二手商品物品商城网站_s926p
  • nodejs基于vue基于MVC模式的考研论坛互动交流系统的私信设计与实现
  • nodejs基于vue技术人人美食菜谱分享点餐配送平台的设计与实现
  • 税筹园区助力企业合规减负与税务优化
  • 气体涡轮流量计 本土精造 精准守护气体管控
  • 企业级邮件服务优化实战:从550错误到高可用架构
  • 格恩朗金属管浮子流量计 本土精造 稳控流体计量
  • Excel动态生成SQL更新语句:批量处理数据的高效技巧
  • 救命神器9个AI论文平台,自考学生轻松搞定毕业论文!
  • vLLM 推理 GPU 选型指南:显存、KV Cache 与性能瓶颈全解析
  • 详解redis(7):数据结构List
  • 详解redis(8):数据结构Hash
  • 详解redis(9):数据结构set
  • 一文学习 了解 OSI模型、TCP/IP模型、网络封包
  • 深入解析:Linux动态存储管理的逻辑卷使用示例
  • 北京附近上门回收酒
  • YOLOv8目标检测:从理论到实战的飞跃之旅
  • 用AI制作表格实战:20个高频ChatExcel指令词,告别低效Excel操作
  • 打破 NotebookLM 最后的限制:我写了个开源工具,把 PDF 瞬间变回可编辑 PPT!
  • 力扣122 买卖股票的最佳时机II java实现