基于Hadoop的一些工具一句话介绍

 

    Pig 是在MapReduce上构建的查询语言(SQL-like),适用于大量并行计算。

 

    Chukwa 是基于Hadoop集群中监控系统,可以用他来分析和收集系统中的数据(日志)

 

    Hive 是DataWareHouse 和 Map Reduce交集,适用于ETL方面的工作


    HBase 是一个面向列的分布式数据库。

 

    Map Reduce 是Google提出的一种算法,用于超大型数据集的并行运算。

 

    HDFS 可以支持千万级的大型分布式文件系统。

 

    Zookeeper  提供的功能包括:配置维护、名字服务、分布式同步、组服务等,用于分布式系统的可靠协调系统。

 

    Avro 是一个数据序列化系统,设计用于支持大批量数据交换的应用

 

    Sqoop 是一个可以将关系型数据库中的数据导入到Hadoop文件系统(HDFS)中的工具 。例如 Mysql的数据向Hive/HBase迁移。支持 Hsqldb、MySQL、Oracle、PostgreSQL等。

 http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值