一、大数据的特点:
1、大量
2、高速
3、多样 :结构化数据和非结构化数据
4、低价值密度
二、大数据的应用场景:视频推荐、电商推荐等
三、大数据的技术发展脉络:
阶段1:单机时代
阶段2:大数据时代-分布式处理
阶段3:实时大数据时代 spark是基于内存的计算,mapReduce是基于磁盘的计算
四、大数据部门组织结构:
五、Hadoop的定义:Hadoop是分布式系统处理架构
六、Hadoop的优势(四高):
1、高可靠性:底层维护多个数据副本
2、高扩展性:在集群间分配任务数据,可方便的拓展数以千计的节点
3、高效性
4、高容错性