
ETL
Chris-Chang
You got a dream, you gotta protect it!
展开
-
1.1 kettle 抽取文本文件
一. 单个文件获取 1.文本文件输入 2.点击内容选项选择正确的格式 3.可以通过文件选项卡里的显示文件内容来查看文本的分隔符 4.选择正确的分隔符 5.点击字段选项获取字段 二 .多个文件获取6.增加获取文件名步骤来批量获取文件名 7.将文本文件输入里修改为以前的步骤获取文件名原创 2015-08-04 21:32:26 · 11955 阅读 · 3 评论 -
1.2 Kettle数据库抽取
一. 通过使用参数查询1. 数据表构建 本次使用的数据表是test数据库中的test表,如下: 2. 自定义常量数据 3.表输入 4. 右键预览查看结果 二. 通过变量替换查询1. 设置一个作业 1. 设置变量转换 2. 表输入转换 3.设置变量 其中的自定义常量数据和上面的一样原创 2015-08-04 22:20:56 · 952 阅读 · 0 评论 -
1.3 Kettle从web抽取数据
一. 基于文本文件的web客户端抽取 由于kettle使用了Apache VFS系统,VFS系统可以像处理文本文件一样处理http文件,所以在‘文本文件输入’步骤中可以直接将URL作为文件名:二. HTTP客户端使用HTTP client 步骤,它调用URL并返回一个字符串作为结果。返回的字符串是用分隔符分割的文本文件或是XML格式的字符串,可以使用XML输入步骤进一步处理。将URL填入生原创 2015-08-05 13:10:46 · 10164 阅读 · 0 评论