概念理解:
Mapreduce是一种模式。
Hadoop是一种框架,适合大数据的分布式存储与计算平台。
Hadoop是一个实现了mapreduce模式的开源的分布式并行编程框架。
一句话概括:在hadoop的框架上采取mapreduce的模式处理海量数据
HDFS:分布式文件系统
MapReduce:并行计算框架
Hadoop的特点(团队作战)
扩容能力:可靠存储和处理千兆字节数据(PB)
成本低
高效率:并行处理
可靠性
Hadoop三种模式:
单机模式:仅限调试
伪分布模式:模拟分布式节点
完全分布式模式:正常的hadoop集群,有多个节点构成