当前位置: 首页 > news >正文

DataX从入门到精通 第1课 ETL之DataX 安装DataX

1、下载DataX源码

地址为https://github.com/alibaba/DataX.git

2、通过maven打包:

在DataX根目录执行打包命令

mvn -U clean package assembly:assembly -Dmaven.test.skip=true

打包成功,日志显示如下:

[INFO] BUILD SUCCESS
[INFO] ------------------------------------------------------------------------
[INFO] Total time: 01:39 h
[INFO] Finished at: 2026-06-03T12:34:15+08:00
[INFO] ------------------------------------------------------------------------

企业微信截图_17804640917695

3、DataX目录

打包成功后的DataX包位于 {DataX_source_code_home}/target/datax/datax/ ,结构如下:

企业微信截图_17804642559503

 4、配置示例:从stream读取数据并打印到控制台

1)第一步、创建作业的配置文件(json格式)

可以通过命令查看配置模板: python datax.py -r {YOUR_READER} -w {YOUR_WRITER},这里执行命令 

python datax.py -r streamreader -w streamwriter

企业微信截图_17804646042515

 2)根据模板配置json如下:

 将stream2stream.json文件放到job目录下,内容如下:
{"job": {"content": [{"reader": {"name": "streamreader","parameter": {"sliceRecordCount": 10,"column": [{"type": "long","value": "10"},{"type": "string","value": "hello,你好,世界-DataX"}]}},"writer": {"name": "streamwriter","parameter": {"encoding": "UTF-8","print": true}}}],"setting": {"speed": {"channel": 5}}}
}

3)运行job

执行命令

chcp 65001
python bin/datax.py ./job/stream2stream.json

企业微信截图_17804661625069

 出现乱码。

4)解决乱码

执行命令 chcp 65001后显示正常,如果不想每次都输 chcp 65001,可以写个批处理。

chcp 65001
python bin/datax.py ./job/stream2stream.json

企业微信截图_17804668445571

 

done!!!

 下一篇文章将讲解DataX-Web安装部署。

image

 

http://www.jsqmd.com/news/957919/

相关文章:

  • 2026连云港防水补漏哪家好?住建实地测评权威榜单TOP5|卫生间免砸砖/阳台屋顶/厨卫漏水维修(6月连云港专项调研) - 苏易修缮
  • opencv识别抖音的评论区其实很简单
  • 告别锐捷客户端:WinSCP+抓包工具,给Padavan路由器‘植入’校园网认证的完整指南
  • 三步突破:重新定义Dell G15散热控制的轻量革命
  • 八目蛛网络(免费工具网站导航)
  • 有没有免费或低成本的工单系统推荐?
  • 如何在3分钟内实现WPS与Zotero的无缝对接:跨平台文献管理终极指南
  • 用Matlab GUI做个指纹锁原型:从图像处理到特征匹配的完整实战(附源码)
  • 新手福音:用快马平台生成burpsuite安装交互教程,三步完成安全工具部署
  • 苏州购宠避坑指南|姑苏+虎丘双店明轩猫犬舍,江南本地繁育健康萌宠优选 - 萌宠俱乐部
  • MatrikonOPC免费工具套件:工业自动化数据集成与通信调试实战指南
  • JEPA范式在VLM中的应用
  • AI会议纪要工具选型指南
  • AI智能体项目的开发流程
  • LayaAir里直接拖选Unity粒子.lh文件,实时预览+自由转视角
  • 深入解析昇腾开发工具集 asc-tools:架构设计与应用实践
  • FPGA高级设计实战:从RTL到高速接口的系统级开发指南
  • AKM系列有铁芯直线电机:大推力与高刚性的精密驱动之选
  • 北京京顺斋,天津全域上门收宝,让每一件藏品都有归处 - 深鉴新闻
  • AI辅助开发网络加密应用:让快马智能生成WebSocket安全通信代码
  • Veo 2光影效果失控?4步精准校准曝光响应曲线,附官方未披露Gamma映射对照表(2024 Q3固件实测)
  • 3分钟找回Navicat密码:你的数据库连接救星工具
  • 2026上海顶尖MBA学费全览:安泰领衔,五校学制与择校指南
  • 3分钟掌握Windows窗口置顶:AlwaysOnTop终极效率指南
  • [t.9.13] Scrum Meeting 13
  • Veo风格迁移不是魔法,是工程——揭秘Meta内部验证的4类不可迁移场景及2种fallback应急方案
  • 【AI伦理治理实战框架】:从0到1搭建企业级AI使用审计体系——含GDPR/网信办双标对照矩阵
  • League Akari终极指南:从英雄联盟玩家痛点到高效解决方案的完全手册
  • 20260605 1
  • Matlab谱减法语音降噪实操包:含完整代码、演示视频与信噪比评估工具