
部分系统归类:
部署,配置和监控 Ambari,Whirr监控管理工具 Hue, karmasphere, eclipse plugin, cacti, ganglia
数据序列化处理与任务调度 Avro, Zookeeper
数据收集 Fuse,Webdav, Chukwa, Flume, Scribe , Nutch
数据存储 HDFS
类SQL查询数据仓库 Hive
流式数据处理 Pig
并行计算框架 MapReduce, Tez
数据挖掘和机器学习 Mahout
列式存储在线数据库 HBase
元数据中心 HCatalog (可以和Pig,Hive ,MapReduce等结合使用)
工作流控制 Oozie,Cascading
数据导入导出到关系数据库 Sqoop,Flume, Hiho
数据可视化 drilldown,Intellicus
转自:http://www.zhihu.com/question/22786302
本文深入探讨了大数据领域的关键技术和工具,包括数据存储、处理、分析、挖掘等方面,涵盖了HDFS、MapReduce、Pig、Hive、Mahout、HBase等核心技术及应用。
1105

被折叠的 条评论
为什么被折叠?



