
一、存储层:文件系统HDFS,NoSQL Hbase
二、资源及数据管理层:YARN以及Sentry等
三、计算引擎:MapReduce、Impala、Spark等
四、基于MapReduce、Spark等计算引擎的高级封装及工具:Hive、Pig、Mahout等
Sqoop (Sql to Hadoop) 被设计为支持批量从结构化数据存储导入数据到HDFS,如关系数据库,企业级数据仓库和NoSQL系统。
本文介绍了Hadoop生态系统的主要组件,包括存储层的HDFS和HBase,资源管理层面的YARN和Sentry,计算引擎如MapReduce、Impala、Spark等,并提到了用于数据导入导出的工具如Sqoop和Flume。

一、存储层:文件系统HDFS,NoSQL Hbase
二、资源及数据管理层:YARN以及Sentry等
三、计算引擎:MapReduce、Impala、Spark等
四、基于MapReduce、Spark等计算引擎的高级封装及工具:Hive、Pig、Mahout等
Sqoop (Sql to Hadoop) 被设计为支持批量从结构化数据存储导入数据到HDFS,如关系数据库,企业级数据仓库和NoSQL系统。
2686
2422

被折叠的 条评论
为什么被折叠?