- 博客(3)
- 收藏
- 关注
转载 Apache Oozie调度
1.Oozie概述 Oozie 是一个用来管理 Hadoop生态圈job的工作流调度系统。由Cloudera公司贡献给Apache。Oozie是运行于Java servlet容器上的一个java web应用。Oozie的目的是按照DAG(有向无环图)调度一系列的Map/Reduce或者Hive等任务。Oozie 工作流由hPDL(Hadoop Process Definition Language...
2019-07-28 18:37:27
276
转载 Cloudera-Manager5.14.0离线安装
Cloudera-Manager5.14.0离线安装 Cloudera Manager是cloudera公司提供的一种大数据的解决方案,可以通过ClouderaManager管理界面来对我们的集群进行安装和操作,提供了良好的UI界面交互,使得我们管理集群不用熟悉任何的linux技术,只需要通过网页浏览器就可以实现我们的集群的操作和管理,让我们使用和管理集群更加的方便。 1、ClouderaMana...
2019-07-28 09:26:14
453
原创 Apache Sqoop介绍及入门总结
1.sqoop介绍 Apache Sqoop是在Hadoop生态体系和RDBMS体系之间传送数据的一种工具。来自于Apache软件基金会提供。 Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。 Hadoop生态系统包括:HDFS、Hive、Hbase等 RDBMS体系包括:Mys...
2019-07-17 18:35:25
332
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人