
Hadoop
LittleCookie_
这个作者很懒,什么都没留下…
展开
-
大数据与Hadoop核心组件-Yarn(5)
作用 负责整个集群资源的管理和调度,是Hadoop的一个通用的资源管理系统 定义 Apache Hadoop YARN (Yet Another Resource Negotiator ,另一种资源协调者)是一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处```
MapReduce实现了分布式计算Hadoop的MapReduce是对google三大论文的MapReduce的开源实现,实际上是一种编程模型,是一个分布式的计算框架,用于处理海量数据的运算,由JAVA实现HDFS(分布式存储) NameNode DataNodeMapReduce(分布式计算) ResourceManger NodeManagerMapReduce原理图## MapReduce角色及概念JobTracker -Master节点只有一个 -管理所有作业任务的监控、原创 2021-05-12 09:41:13 · 149 阅读 · 0 评论 -
大数据与Hadoop核心组件-HDFS(3)
HDFSHadoop Distributed File System(Hadoop分布式文件系统)HDFS 分布式存储,解决海量数据的存储HDFS特点及原理 HDFS具有扩展性(横向扩展,任意添加数据节点datanode)、容错性(副本冗余机制默认3份 默认切片大小 1.0版本-64M 2.0~3.0版本 128M)、海量数量存储的特点 原理为将大文件切分成指定大小的数据块,并在分布式的多台机器上保.存多个副本 HDFS角色和概念 1.Client 切分文件、访问HDFS与NameN原创 2021-05-12 09:38:12 · 215 阅读 · 0 评论 -
大数据与Hadoop概述(2)
Hadoop概念定义 Hadoop是Yahoo!开发,后贡献给了 Apache 的一套开源的、可靠的、可扩展的用于分布式计算的框架 Hadoop作者 Doug cutting Hadoop名字由来 以Hadoop作者的孩子的一个棕黄色的大象样子的玩具的命名Hadoop特点高可靠性 Hadoop按位存储和数据处理的能力值得信赖高扩展性 Hadoop通过可用的计算机集群分配数据,完成存储和计算任务,这些集群可以方便地扩展到数以干计的节点中,具有高扩展性高效性 Hadoop能够原创 2021-05-12 09:33:42 · 67 阅读 · 0 评论 -
大数据与Hadoop(1)
大数据的由来随着计算机技术的发展,互联网的普及,信息的积累已经到了一个非常庞大的地步,信息的增长也在不断的加快,随着互联网、物联网建设的加快,信息’更是爆炸式增长,收集、检索、统计这些信息越发困难,必须使用新的技术来解决这些问题什么是大数据【1】定义大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产【2】总结大数据是指即从各种各样类型的数据中,获得有价值的信息分布式存储,原创 2021-05-12 09:18:54 · 90 阅读 · 0 评论