
大数据应用
今夕何夕-l
这个作者很懒,什么都没留下…
展开
-
Hadoop的基本属性
众所周知,Hadoop是一款可靠的、可伸缩的、分布式计算的开源软件;1.四v特征:(1).volumn:海量数据,单个数据容量大。(2)velocity:速度快,读写数据必须要高速。(3)variaty:多样性,数据类型多而复杂,可以存储文本、图片、视频等复杂数据;包括半结构化数据和非结构化数据(4)value:价值密度低,单条数据无意义,但是多条或者多组数据之间就存在一定价值信息。2.三大核心:(1)HDFS hadoop(分布式文件存储系统):将海量数据分成容量相同的多段数据原创 2020-06-04 17:34:25 · 614 阅读 · 0 评论 -
liunx下的hadoop的简介与安装
Hadoop是一款可靠的、可伸缩的、分布式计算的开源软件。是一个框架、允许跨越计算机集群的大数据集处理,使用简单的编程模型(MaoReduce)。可从单个服务器扩展到几千台主机,每个节点提供了计算和存储的功能。而不是依赖高可用性的机器,依赖于应用层面上的实现Hadoop有四大模块1.haddoop common 公共类库2.HDFS hadoop 分布式文件系统3.Hadoop yarn 作业调度和资源管理框架4.Hadoop MapRedu...原创 2020-06-01 18:28:14 · 178 阅读 · 0 评论