主流大数据技术

本文介绍了两种主要的大数据处理技术:非实时处理技术包括HDFS、MapReduce和Hive,适用于大规模数据集的批处理;实时处理技术如HBase、Kafka和Storm,用于流数据的实时分析。HDFS提供流式文件读取,MapReduce简化复杂逻辑处理,YARN作为资源管理和调度框架。HBase用于非结构化数据存储,Hive则作为基于Hadoop的数据仓库工具。

俩类技术:

非实时:HDFS、MapReduce、Hive

实时:HBase、KafKa、Storm

HDFS:实现流式读取文件系统的目的

MapReduce:对负责逻辑进行高度归约,抽象为Mapper和Reducer类,复杂逻辑通过理解,转化为符合MapReduce函数助理的模式。

YARN:新的资源管理和应用调度框架,云操作系统(cloud OS)

HBase:非关系型数据库,适合于非结构化数据存储,它的存储模式基于列

Hive:Apache基金会下面的开源框架,基于Hadoop的数据仓库工具

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值