当前位置: 首页 > news >正文

助睿实验作业1-订单利润分流数据加工

一、实验背景

1.1 实验目的

本次实验旨在掌握零代码数据集成平台的核心操作与 ETL 基础方法,具体包括:

• 熟悉数据转换任务的创建、组件添加与任务执行的完整流程;

• 掌握数据读取、多表关联、字段筛选、条件分流与文件输出等常用功能的配置;

• 理解数据关联、过滤与分支处理的设计逻辑。

通过本次实验,能够独立完成订单数据的利润计算与分类处理,为后续数据加工任务打下基础。

1.2 实验环境

实验平台:助睿数智(Uniplore)一站式数据科学平台(https://lab.guilan.cn/)

数据库:MySQL

数据表:订单表、产品表

1.3 业务场景

企业经营分析中,常需要关联订单与产品数据计算利润,并按利润正负对订单进行分类存储。本实验以此场景为例,用零代码方式完成数据处理。

1.4处理流程

将订单明细表与产品信息表进行左外连接,合并订单与产品数据;清洗数据、去除冗余字段后,按订单利润是否大于等于零进行分流;最终将盈利订单和亏损订单分别导出为两个独立的 Excel 文件。

二. 实验步骤

2.1登录助睿实验平台(https://www.guilan.cn/home)

进入我的学习后点击进入实训平台

2.2创建实验项目

然后点击右上角进入项目

2.3获取数据

打开后在项目页面中,我们能看见左侧包含 3 个核心菜单:资源库、文件库、元数据管理。

• 资源库:用于工作流的全生命周期管理,包括新建、删除、修改和查看工作流信息,也支持工作空间的导入导出、任务调度管理等操作。

• 文件库:用于存储工作流运行所需的源文件,以及工作流执行过程中生成的输出文件。

• 元数据管理:是数据集成的基础支撑模块,可为工作流配置运行环境、数据库连接、Flink 集群等底层参数。

本次实验中,我们主要使用到资源库和文件库两大模块。

首先我们点击右键同步数据

随即进入文件夹后再切换回到元数据,就可以看到成功同步的数据库“线上公共数据源(Readonly)”

2.4新建转换流

切换到资料库,然后点击右键,新建转换流,输入名字然后进入转换流

进入后要先点击锁解锁才能进行下一步操作

2.5添加组件

(1) 添加表输入组件

在搜索输入框中输入“表输入”,即可查询到“表输入”组件。通过拖拽添加表述瑞组件

重复以上操作再次添加。然后右键点击进行表组件编辑。

将名字编辑为我们想要的。

(2)添加记录集连接组件​

使用表输入组件读取数据后,需要通过记录集连接组件将表输入组件的数据进行关联。​

在搜索输入框中输入“记录集连接”,将记录集连接组件拖拽至画布中。

再将两个组件之间用箭头连接起来

(3)添加字段选择组件

然后右键编辑组件,填写名字

再将组件之间连接起来

(4)添加过滤记录组件​

本次实验是根据订单的利润情况对订单进行分流。使用“过滤记录”组件可以根据记录中某个字段的值进行记录分流。​

在搜索输入框中输入“过滤记录”,将过滤记录组件拖拽至画布中

再将其宇前一个组件连接起来,会有弹窗提示选择主输出步骤即可

(5)添加 excel 输出组件​

记录经过“过滤记录”组件后会被分成2个记录流。我们可以根据业务需求将2个记录流输出到指定位置(文件、数据库表)。在本次实验中,我们选择将记录输出到 Excel 文件中。​

在搜索输入框中输入“excel 输出”,将2个表输出组件拖拽至画布中,再右键编辑他们的名字

将其与前一个组件连接时出现弹窗,当连接的是盈利订单时选择true

当连接的是亏损订单时选择false

2.6配置组件信息

(1)表输入组件配置​

双击订单_详细订单表输入组件,弹出组件配置页面。在数据库连接下拉框中选择“线上公共数据源(Readonly)”,再点击“获取SQL查询语句”,自动生成SQL查询语句。

点击后出现弹窗,选择表。

下滑找到“business_anaylsis.order_detail”并点击它,再点击“确定”

我们想要的sql语句自动生成了

另外一个表组件使用相同的操作,配置“business_anaylsis.product”的SQL查询语句。

(2) 记录集连接组件配置​

编辑记录集连接组件,在下拉列表中选择需要连接的数据来源​

第一个Transform选择详细订单,第二个Transform选择产品信息,连接类型选择LEFT OUTER

然后点击获取连接字段

另外一列相同操作

第一个Transform字段保留 produc_id,第二个Transform的字段保留 id,连接类型选择LEFT OUTER

第一个Transform字段中除了 produc_id 外的其他字段,右键点击“删除选中的行”,第一个Transform字段中除了id 外的其他字段,右键点击“删除选中的行”

(3)字段选择组件配置

记录集连接后,produc_id与id字段内容重复,需移除id字段。操作:双击 “移除产品 ID_1 字段” 组件,选择 “移除” 模式,点击 “获取字段” 并移除id字段即可。

右键获取字段

然后删除除了id以外的其他字段

再点击确认

(4)编辑配置过滤记录

双击“过滤记录”,选择字段利润(profit),选中“profit(Number)”后点击“确定”

再在中间字段选择>=

点击“value”,值类型选择“Integer”,值输入“0”

(5) 编辑excel输出组件配置

双击“盈利订单”excel表输出组件,出现弹窗,将文件名修改为“盈利订单”,选择文件拓展名“xlsx [Excel 2007 and above]”​,另外一个excel组件进行相同的配置操作。

再切换输出字段

获取字段后

2.7输出结果

点击按钮进行转换

执行成功

三. 实验结果

获得两个表格

输出文件

内容

说明

盈利订单.xlsx

profit ≥ 0 的订单

可进一步分析高利润产品

亏损订单.xlsx

profit < 0 的订单

可用于亏损原因追踪

四. 问题与解决

1. 当编辑过滤记录时发现没有profit选项

解决方案:往前寻找前面组件配置有没有出错,发现在前一个组件中应在移除中保留id字段,结果误在选择与修改中保留id导致出错

五. 实验总结

本次实验基于助睿零代码 ETL 平台完成了订单数据的关联、清洗与分流处理。实验中,我掌握了新建转换任务、配置表输入与 Excel 输出组件的操作流程,熟练运用字段选择、记录集连接、过滤记录等组件,实现了订单明细表与产品信息表的左外连接,完成重复字段移除,并按利润正负将数据分流导出为盈利与亏损订单文件。通过实验,我理解了多表关联与数据分流的 ETL 设计思路,提升了零代码数据处理的实践能力,为后续复杂数据加工任务打下了基础

http://www.jsqmd.com/news/754160/

相关文章:

  • 【C语言逻辑题】谋杀案凶手是谁?——经典矛盾推理题详解
  • 神经网络在三轴燃气轮机建模仿真和故障诊断中的应用特性曲线预测【附代码】
  • 2025最权威的降AI率神器横评
  • 基于Whisper、Llama与Kokoro的本地实时语音对话机器人构建指南
  • AHK2_Lib:让AutoHotkey V2从脚本工具蜕变为专业开发平台
  • 用STM32CubeMX快速配置BH1750光照传感器,OLED实时显示并串口打印数据(附完整工程)
  • ESP32-C3硬件I2C不够用?手把手教你用SlowSoftWire库扩展软件I2C(以VL53L0X为例)
  • Scrcpy Mask实用指南:专业级安卓设备投屏与键盘映射解决方案
  • 如何免费解锁百度网盘SVIP高速下载:macOS用户终极指南
  • 分层奖励机制在空间智能模型中的应用与实践
  • 26ai OGG 微服务高可用部署及切换
  • 贵阳本地GEO首选贵阳伍子柒网络,懂贵阳市场,适配本地企业推广需求
  • Python 的 Pandas
  • 保姆级教程:在STM32G4上通过串口搞定FreeMASTER数据可视化(附源码)
  • 从GEE下载TFRecord分片文件到本地训练?这份TensorFlow数据管道构建指南请收好
  • Steam Deck控制器Windows适配终极指南:5分钟让游戏手柄完美兼容
  • Godot 4集成Lua:从脚本语言到嵌入式运行时的完整指南
  • 开发者技能树知识库:结构化学习路径与社区共建指南
  • 手把手教你玩转Codesys定时器:TON、TOF、TP、RTC功能块实战配置
  • Flutter for OpenHarmony 智能备忘录笔记APP 实战DAY3:新增笔记页面跳转+编辑表单布局+笔记本地持久化保存
  • 慧知开源虚拟电厂(VPP)核心平台PRD需求文档(大白话与专业结合版)- 慧知开源充电桩平台
  • 52.YOLOv8 口罩检测全流程:Labelme 标注 + 训练部署 + 源码可直接运行
  • 如何在 NestJS 中配置全局异常过滤器捕获异步拒绝错误
  • Merkle 树的认证路径
  • 2026年5月值得信赖的河北太行金景墙源头厂家有哪些厂家推荐榜,太行金景墙、柏坡黄景墙、中国黑景墙、干垒石墙、石皮地铺石厂家选择指南 - 海棠依旧大
  • 面试官最爱问的堆排序(Heap Sort)优化技巧与常见‘坑点’,我用Python和Go都实现了一遍
  • 计算 FORS 签名
  • C++ DoIP通信异常排查实战(车载以太网调试黑盒解密)
  • 实测有效!.NET 8项目里用Spire.Office最新版去水印的完整流程(附代码)
  • 2026年5月评价高的白洋淀整院出租排行榜厂家推荐榜,家庭出游型/团队型/含餐型/整院型厂家选择指南 - 海棠依旧大