*IT Kettle:足迹第二十六步了解大数据中的ETL工具Kettle

本文介绍了大数据项目中使用Kettle进行数据抽取的过程和核心功能,包括新建转换和作业。文中列举并详细解释了6种常见的Kettle运行时遇到的Oracle错误及其解决方案。此外,还讨论了提高页面加载速度的策略,如延迟统计总数的查询或预计算数据。

把大数据讲成故事:第1步是抽取过去数据,第2步是找出规律,第3步是找出证据,第4步是让机器使用规律;

我进入项目组后,前期做Kettle数据抽取,就是第1步;后期负责大数据的可视化展示,也就是上述第2,3步;用各种Echart作页面展示;

Echart介绍过好多,我以后专门写一篇关于Echart数据分析的文章,讲我做Echart数据分析的经验与坑;

现在只说Kettle数据抽取,Kettle的核心用法在于新建转换(临时抽取表)和新建作业(start时定时抽取表);临时抽取表,Navicat自带功能也可以支持,Navicat定时抽取就不行了;

kettle异常1:ORA-01722: 无效数字

原因:来源表中的varchar字段,插入出目标表number类型的字段里

方法1:加个字段选择组件,将数据类型强转;

方法2:在sql里用函数将数据类型强转;

kettle异常2:ORA-01481:无效的数字格式模型

原因:字段本就是String,误看作了时间格式,却使用了to_char(xxxx,'yyyy-mm-dd')函数。

方法:去to_char

kettle异常3:ORA-01830:日期格式图片在转换整个输入字符串之前结束

to_date(t.start_time,'yyyy-mm-dd')

原因:转时间时字符串格式不对,具体数据格式为:2016-03-01 03:21:57

方法:加上时分秒

to_date(t.startTime,'yyyy-mm-dd hh24:mi:ss')

kettle异常4:ORA-01843: 无效的月份

原因:时间字段是字符串,强转时有问题数据;有2019/01/01,也有2019-01-01

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值