ETL工具有哪些，Smartbi大数据分析工具

最新推荐文章于 2021-02-23 23:51:27 发布

原创最新推荐文章于 2021-02-23 23:51:27 发布 · 1.2k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

本文介绍如何使用Smartbi工具实现自助ETL（数据抽取、转换、加载），以处理多来源异构数据，提升数据质量，适应不同分析方法。通过具体案例展示数据预处理及输出过程。

ETL（Extract-Transform-Load ）用来描述将数据从来源端经过萃取（Extract）、转置（Transform）、加载（Load）至目的端的过程，是构建数据仓库重要的一环，是商业智能的核心和灵魂。

ETL特色功能

管理简单：采用元数据方法，集中进行管理；接口、数据格式、传输有严格的规范；尽量不在外部数据源安装软件；数据抽取系统流程自动化，并有自动调度功能；抽取的数据及时、准确、完整；可以提供同各种数据系统的接口，系统适应性强；提供软件框架系统，系统功能改变时，应用程序很少改变便可适应变化；可扩展性强。

自助ETL的主要应用场景是将多来源的异构数据，进行处理后得到具备完整性、一致性的数据模型。使用自助ETL可以提高数据的质量、适应不同的数据分析方法。

需求场景

想要对产品的销售情况进行分析，数据源中有一张产品销售表，先根据需求对数据进行处理，然后进行数据分析。

下面我们通过Smartbi大数据分析工具来展示自助ETL实现方案

数据基础

数据源中“产品销售表”的数据预览如下：

操作步骤

1、在Smartbi系统主界面的快捷菜单中选择数据准备 > 自助ETL，进入“自助ETL”管理界面：

2、在“Smartbi自助ETL”管理界面中，选择新建自助ETL 按钮，进入“新建ETL”定制界面。

3、在此界面可以设计定制ETL工作流。

数据源

1、将关系数据源节点拖入画布区，在节点配置区设置关系数据源的参数。

2、在关系数据源上右键选择执行到此处，运行当前节点。

3、点击查看输出，可查看关系数据源节点输出的数据，如下：

将表的数据导入当前工作流完成，下面对数据进行数据预处理。

数据预处理

需要在表中添加序号，并去除采购金额字段的小数位。

1、将增加序列号节点拖入画布区，连接两个节点，设置序列列名称。

2、将派生列节点拖入画布区，连接两个节点。在节点配置区选择派生列配置按钮。

3、将对应函数和字段分别拖入添加/编辑表达式区，点击确定按钮，添加一条“采购金额取整”的派生列。

4、在派生列节点上右键，选择执行到此处，运行当前节点。派生列节点输出的数据如下：

数据预处理完成，下面将处理好的数据输出。

目标源

将处理好的数据输出成一张新的表。

1、将关系目标源家待拖入画布区，选择输出表的数据源、SCHEMA，并选择新建表按钮。

2、新的表命名为“产品销售数据表”，点击创建表按钮。

3、点击运行按钮，创建一张新的表。

流程运行完成后，关系目标源节点输出的数据如下：

在数据源中查看刚才创建的“产品销售数据表”表，预览表中的数据如图：

使用Smartbi自助ETL处理数据完成，下面可对产品销售情况进行数据分析，详情可以到Smartbi官网demo体验，或申请试用。全模块长期开放免费试用哦。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。