大数据入门系列文章
1.大数据入门-大数据是什么
大数据入门系列文章
=========
你知道什么是大数据吗,请走传送门。
1.大数据入门-大数据是什么
一、概念
====
大数据技术是指在构架大数据平台的时候需要的技术。包含存储系统,数据库,数据仓库,资源调度,查询引擎,实时框架等。下面以我目前所了解到的一些技术做简要介绍。目前之介绍简单概念。
二、技术详解
======
1.基础架构:Hadoop
1.架构
2.简介
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。
2.分布式文件系统:HDFS
1.HDFS架构
2.简介
指被设计成适合运行在通用硬件上的分布式文件系统。
3.特点
HDFS有着高容错性的特点,并且设计用来部署在低廉的硬件上。而且它提供高吞吐量来