hadoop基础入门知识

hadoop已经发展了10年了。

        《hadoop技术详解》

        《hadoop权威指南》

google的大数据技术:MapReduce,TigTable,GFS

hadoop的优点:

        (1)成本降级,能用PC机,就不用大型机和高端存储

        (2)软件容错硬件故障视为常态,通过软件保证可靠性

        (3)简化并行分布式计算,无需控制节点同步和数据交换


hadoop:一个模仿Google大数据技术的开源实现

1.hadoop是什么?

  开源的,分布式存储,分布式计算平台

2,核心

HDFS:分布式文件系统,存储海量的数据

MapReduce:并行处理框架,实现任务分解和调度

3,作用

搭建大型数据仓库,PB级数据的存储,处理,分析,统计等业务

4,优势

高扩展

低成本

成熟的生态圈(小工具)

5,小工具

Hive

HBase  存储结构化数据的分布式数据库 

            放弃了事物特性,追求更高的扩展(不同于传统的关系型数据库)

           提供数据的随记读写和实时访问,实现对标数据的读写功能(区别于HDFS)

6.zookeeper-----管理员




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值