基于hive的dip-data-analyze

本文介绍了如何结合Hive和Quartz构建一个名为DIP-data-analyze的数据分析平台,旨在简化数据分析流程。通过提供一个界面化的任务管理界面,允许用户轻松定义表、分析语句和任务调度,极大地提高了数据分析效率。

这段时间一直在整dip-data-analyze ,名称是自己定义的,呵呵。


进入公司以来,就专心研究下hive,感觉hive让分析人员分析数据方便非常多,通过将日志转成表,像操作mysql的方式去统计数据,无疑是方便很多。但是也带来个问题,就是

分析人员必须在服务器操作shell ,敲入sql才可以,操作起来不方便;对于那些一天跑几次或者定期执行的任务,更是不便。


正好以前用的java计划框架quartz给了我灵感。如果能够在界面让用户定义表,定义分析语句,来定义一个分析任务,同时将任务加入计划,那么用户就会方便很多!


这就是dip-data-analyze 得来最初的想法!


晒下 最初的架构:



dip-data-analyze 运用java写的,计划调度用的quartz,底层用的hiveserver来进行分析,当然这些都建立在hadoop(hdfs、MR)之上。

看下任务管理界面:



评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值