ETL工具Kettle进行数据的抽取、转换、装载

本文介绍了如何使用ETL工具Kettle进行数据处理,包括从Excel文件中抽取数据并加载到数据库。详细阐述了创建转换、设置Excel输入、字段选择、表输出等步骤,以及解决数据装载过程中的非空约束问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

 

1、ETL工具Kettle简介

2、Spoon安装

3、界面展示

4、实现需求,对数据进行抽取

4.1 将excel表中的数据先完全装载到一个表中

4.1.1 创建一张表,其SQL语句如下所示。 

4.1.2    新建转换

4.1.3 excel输入

4.1.4 字段选择

4.1.5 表输出

4.1.6  启动转换

4.1.7 查询数据库中表

       4.2  将zgcs表中的一线城市的一些数据传入到yx表中

4.2.1  表yx的SQL语句

4.2.2  表输入

4.2.3 表输出

4.2.4  启动转换

4.2.5 解决非空约束(创建序列) 

4.2.6 查询转换后的表yx


需求:有个excel表,里面包含了中国城市一线、新一线、二线城市的名称及编码,我们需要将一线城市放入到postgres数据库下yx这张表中,新一线、二线分别放入到期相对应的表中?如何能够快速做到。下面excel文件欢迎下载:中国城市划分历览excel版-其它文档类资源-优快云下载

解决方式一:按照普通方式的话,我们就是直接编写很多添加的SQL语句,将数据添加到相对应的表中,但是表数据达到上百条、上千条,就不说上万、上百万、上亿的数据量了,就会花费我们大量的时间去表写添加的SQL语句,效率过低,重复量过大,而且人写的估计也要吐血了。鉴于此,我们可以使用解决方式二。

解决方式二:使用ETL工具Kettle对excel表中的数据进行相对应的操作,从而将其数据插入到相对应的表中。

1、ETL工具Kettle简介

        免费开源的基于java的企业级ETL工具,功能强大,简单易用,无可抗拒.

 ETL(Extract-Transform-Load),即数据抽取、转换、装载的过程,对于企业或行业来说,我们经常会遇到各种数据的处理、转换、迁移,所以,学会使用ETL工具非常有必要,其支持图形化的GUI,以工作流的形式流转,在一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面都非常不错,通过对其的熟练使用,可以减少非常多的工作量,提高工作效率。

2、Spoon安装

        访问官网,Kettle中文网 – Kettle安装、Kettle使用、Kettle中文,支持一键安装。

 3、界面展示

双击spoon.bat批处理文件,展示的界面如下所示。

 4、实现需求,对数据进行抽取

4.1 将excel表中的数据先完全装载到一个表中

4.1.1 创建一张表,其SQL语句如下所示。 

--中国城市
CREATE TABLE zgcs (
	csjb varchar(100) NULL,
	xssx int4 NULL,
	csdm varchar(10) NULL,
	csmc varchar(100) NULL
);

查询一下表格,select * from zgcs,可以看到表是一张空表

<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值