目录
2、安装完JDK ,复制jdk的BIN目录路径,并且在“编辑系统环境变量”中,配置环境变量💗
3、配置完环境变量,可以在终端中查看,输入java -version查看版本信息,如果能够输出版本信息,则java环境变量配置成功💗
4、将kettle压缩包解压后 点击spoon.bat 即可开启kettle💗
一、初步了解ETL ,什么叫ETL🤔
1、E:Extract 抽取数据 💕
- 从多种不同的数据源中抽取数据(从不同数据源中抽取数据的方式不一样)
2、T:Transform 转换数据💕
3、L:Load 数据加载💕
-
数据处理 : 数据的拆分, 合并,单位统一.统一逻辑等
-
数据清洗 : 处理异常值,缺失值,重复值 (不破坏数据的客观规律)
-
一般是将数据加载到数据仓库中,但是也可以加载到备份文件或者日志记录中.
-
在开发中,重要的数据信息,我们通常会保存不止一份(数据仓库存储+文件备份)
二、为什么使用ETL工具 ❓❓❓
ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
应用于数据库和数据仓库中
三、kettle工具的使用💢
1、安装kettle之前,一定要安装jdk💗
jdk : java 开发工具包 (java开发环境);
jre : java 运行时环境 (java运行环境);
jvm : java 虚拟机环境 (java跨平台基础);