什么是ETL:
E: extract 抽取数据
- 从多种不同的数据源中抽取数据(从不同数据源中抽取数据的方式不一样)
T: transform 转换数据
- 数据处理 : 数据的拆分, 合并,单位统一.统一逻辑等
- 数据清洗 : 处理异常值,缺失值,重复值 (不破坏数据的客观规律)
L: load 数据加载
- 一般是将数据加载到数据仓库中,但是也可以加载到备份文件或者日志记录中.
- 在开发中,重要的数据信息,我们通常会保存不止一份(数据仓库存储+文件备份)
Windows安装Kettle
安装kettle 之前必须先安装jdk
jdk : java 开发工具包 (java开发环境)
jre : java 运行时环境 (java运行环境)
jvm : java 虚拟机环境 (java跨平台基础)
安装过程:
1.安装jdk8, 存放到指定位置即可,但是务必要能够找到该软件
2.找到java.exe文件的文件路径,并复制该文件路径

3.

最低0.47元/天 解锁文章
7061

被折叠的 条评论
为什么被折叠?



