
Hadoop
文章平均质量分 92
Hadoop相关知识
早拾碗吧
g g s-d d u
展开
-
Hadoop概述
Hadoop 是一种分析和处理大数据的软件平台,是一个用 Java 语言实现的 Apache 的开源软件框架,在大量计算机组成的集群中实现了对海量数据的分布式计算。Hadoop 采用 MapReduce 分布式计算框架,根据 GFS 原理开发了 HDFS(分布式文件系统),并根据 BigTable 原理开发了 HBase 数据存储系统。Hadoop 和 Google 内部使用的分布式计算系统原理相同,其开源特性使其成为分布式计算系统的事实上的国际标准。原创 2024-04-29 11:02:15 · 1940 阅读 · 0 评论 -
大数据概述
大数据本身是一个抽象的概念。从一般意义上讲,大数据是指无法在有限时间内用常规软件工具对其进行获取、存储、管理和处理的数据集合。一般情况下,如果当前的工具无法处理一个数据集的话,那么这个数据集在当下就会被称之是大数据集;目前,业界对大数据还没有一个统一的定义,但是大家普遍认为,大数据具备 Volume、Velocity、Variety 和 Value 四个特征,简称“4V”,即数据体量巨大、数据速度快、数据类型繁多和数据价值密度低。大数据的主要特点-4V。原创 2024-04-29 10:10:21 · 1703 阅读 · 0 评论