
Kettle
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。
weixin_43563705
将自己的所学到的知识分析给大家
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
如何将KETTLE部署在Linux上
大家好,欢迎来到本篇博客,博主是一名刚入大数据行业的小白,利用空闲的时间来分享自己所学的知识,帮助和博主一样刚处于起步阶段的同学,水平不高,若有什么错误和纰漏之处恳请大佬不吝赐教,目前个人博客只有优快云:https://zhenyu.blog.youkuaiyun.com/,感谢大家的支持,谢谢送给大家一句话:今日事,今日毕本篇博客主要讲解:在Linux上部署KETTLEKettle数据源小结数据源小结--------感谢大家的支持,若有什么不正确的地方还请大家能及时的反馈,记得点赞收藏支持一下.原创 2020-11-05 00:45:41 · 8696 阅读 · 2 评论 -
如何在Linux上部署Kettle?你不想知道吗?
说两句:希望大家能坚持有计划的学习,在文章的末尾可以扫码进群讨论,另外有福利等着大家送给大家一句话今日事,今日毕KETTLELinux安装KettlePan——转换执行引擎Kitchen——作业执行引擎小结Linux安装Kettle用File Zilla将kettle上传到Linux服务器,并解压缩在命令行执行./pan.sh -version./kitchen.sh -version如果能够看到以下输出,表示kettle可以正确运行2019/10/09 08:49:.原创 2020-10-23 09:46:15 · 5242 阅读 · 8 评论 -
从说话到走路手把手教学KETTLE
说两句:希望大家能坚持有计划的学习,在文章的末尾可以扫码进群讨论,另外有福利等着大家送给大家一句话今日事,今日毕KETTLE大数据岗位需求Kettle介绍Kettle安装&配置Kettle入门案例需求实现步骤具体实现Kettle数据流结构图Kettle输入 / 输出组件输入组件JSON数据文件输入表输入生成记录输出组件文本文件输出表输出插入更新删除小结大数据岗位需求---------------------------------------先一起看一下大数据岗位的基本要求--.原创 2020-10-21 18:26:24 · 905 阅读 · 5 评论 -
如何使用KETTLE实现国定法定节假日?
大家好,欢迎来到本篇博客,博主是一名刚入大数据行业的小白,利用空闲的时间来分享自己所学的知识,帮助和博主一样刚处于起步阶段的同学,水平不高,若有什么错误和纰漏之处恳请大佬不吝赐教,目前个人博客只有优快云:https://zhenyu.blog.youkuaiyun.com/,感谢大家的支持,谢谢送给大家一句话:今日事,今日毕本篇博客主要讲解:使用KETTLE实现法定国家日目标:能够使用kettle生成日期维度数据法定节假日生成日期维度数据使用Kettle构建以下组件结构图组件配置生成日期维.原创 2020-10-27 11:28:28 · 2124 阅读 · 5 评论 -
Kettle调优总结
Kettle调优总结调整JVM大小进行性能优化,修改Kettle根目录下的Spoon脚本。参数参考:-Xmx2048m:设置JVM最大可用内存为2048M。-Xms1024m:设置JVM促使内存为1024m。此值可以设置与-Xmx相同,以避免每次垃圾回收完成后JVM重新分配内存。-Xmn2g:设置年轻代大小为2G。整个JVM内存大小=年轻代大小 + 年老代大小 + 持久代大小。...原创 2020-05-03 18:31:16 · 4057 阅读 · 3 评论 -
Kettle:千亿数据仓库整合大数据平台[不学白不学]!!!保证你收益匪浅
Kettle整合大数据平台Kettle整合Hadoop:Hadoop环境准备查看hadoop的文件系统通过浏览器访问http://node1:50070/通过终端访问hadoop fs -ls / # 查看文件在hadoop文件系统中创建/hadoop/test目录hadoop fs -mkdir -p /hadoop/test 在本地创建1.txtvi...原创 2020-04-29 20:32:56 · 3725 阅读 · 2 评论 -
Kettle:千亿数据仓库基础练习[不学白不学]!!!保证你收益匪浅
可视化ETL工具KettleETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。Kettle介绍对于企业或行业应用来说,经常会遇到各种数据的处理,转换,迁移,掌握一种etl工具的使用,必不可少,这里要学习的ETL工具...原创 2020-04-29 17:18:40 · 4085 阅读 · 3 评论 -
【Kettle】 Kettle入门解析(五)
一、资源库【1】数据库资源库1、概述数据库资源库是将作业和转换相关的信息存储在数据库中,执行的时候直接去数据库读取信息,很容易跨平台使用2、使用准备操作:在MySQL中创建数据库kettle1)点击右上角connect,选择Other Resporitory2) 选择Database Repository3) 建立新连接,选择我们之前创建的数据库 kettle4) 填好之后...原创 2020-04-24 09:05:03 · 3728 阅读 · 2 评论 -
【Kettle】 Kettle入门解析(四)
Kettle实战1(增加序列 json2hdfs)部分原始数据:user.json如下结果如下????Kettle实战2(字段选择 json2hdfs)部分原始数据:user.json如下结果如下????Kettle实战3(switch json2excel)结果如下????Kettle实战4(笛卡尔积 excel2excel)...原创 2020-04-24 08:47:06 · 3242 阅读 · 2 评论 -
【Kettle】 Kettle入门解析(三)
Kettle实战1(将csv数据输出为Excel数据)原始数据: user.csv ????转换后数据: user_csv2excel.xls ????Kettle实战2(将json数据输出为Excel数据)部分原始数据: user.json ????转换后数据: user_json2excel.xls ????Kettle实战3(将MySQL数据输出为Excel数据)原始数据...原创 2020-04-24 08:46:30 · 3120 阅读 · 2 评论 -
【Kettle】 Kettle入门解析(二)
Kettle实战1(将Hive表的数据输出到Hdfs)【1】环境准备1)进入Kettle的plugins\pentaho-big-data-plugin目录,编辑plugin.properties文件根据自己的hadoop版本添加不同的类型,我的是cdh的,所以添加cdh514有哪些版本可以在该目录下查看plugins\pentaho-big-data-plugin\hadoop-co...原创 2020-04-24 08:45:56 · 3194 阅读 · 2 评论 -
【Kettle】 Kettle入门解析(一)
一、Kettle概述【1】什么是Kettle?Kettle是一款国外开源的ETL工具,纯Java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定【2】Kettle核心知识1)Kettle工程存储方式1、以XML形式存储2、以资源库方式存储(数据库资源库和文件资源库)2)Kettle的两种设计3)Kettle的组成4...原创 2020-04-24 08:44:54 · 3490 阅读 · 2 评论