hadoop已经发展了10年了。
《hadoop技术详解》
《hadoop权威指南》
google的大数据技术:MapReduce,TigTable,GFS
hadoop的优点:
(1)成本降级,能用PC机,就不用大型机和高端存储
(2)软件容错硬件故障视为常态,通过软件保证可靠性
(3)简化并行分布式计算,无需控制节点同步和数据交换
hadoop:一个模仿Google大数据技术的开源实现
1.hadoop是什么?
开源的,分布式存储,分布式计算平台
2,核心
HDFS:分布式文件系统,存储海量的数据
MapReduce:并行处理框架,实现任务分解和调度
3,作用
搭建大型数据仓库,PB级数据的存储,处理,分析,统计等业务
4,优势
高扩展
低成本
成熟的生态圈(小工具)
5,小工具
Hive
HBase 存储结构化数据的分布式数据库
放弃了事物特性,追求更高的扩展(不同于传统的关系型数据库)
提供数据的随记读写和实时访问,实现对标数据的读写功能(区别于HDFS)
6.zookeeper-----管理员