大数据系列（8）Hadoop生态简介

GitCloud

于 2020-04-15 21:56:31 发布

阅读量164

点赞数

分类专栏：大数据文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_43430261/article/details/105545115

版权

大数据专栏收录该内容

8 篇文章

订阅专栏

生态圈

HBase简介

高可靠，高性能，面向列，可伸缩，实时读写的分布式数据库
利用HDFS作为其文件存储系统，支持MR程序读取数据
存储非结构化和半结构化数据

RowKey：数据唯一标识，按字典排序
Column Family：列族，多个列的集合，最多不要超过3个
**TimeStamp时间戳：**支持多版本数据同时存在
在这里插入图片描述

Spark

基于内存的大数据并行计算框架
Spark是MapReduce的替代方案，兼容HDFS，HIVE等数据源
抽象出分布式内存存储数据结构，弹性分布式数据集RDD
基于事件驱动，通过线程池复用线程提高性能

博客等级

码龄7年

51
原创

60
点赞

218
收藏

31
粉丝

关注

私信

热门文章

分类专栏

Linux设备驱动程序 1篇
linux 9篇
kali 3篇
zsh 1篇
CVE复现 1篇
技术 4篇
PWN知识 5篇
编译器 3篇
大数据 8篇
PWN题解 3篇
杂 1篇
开发 3篇
加密与解密 1篇
逆向工程核心原理 1篇
Python笔记 2篇
机器学习 4篇

展开全部收起

上一篇：: 大数据系列（7）Hadoop总结及延伸思考

下一篇：: 机器学习3--梯度下降代码举例

最新评论

PWN-最新checksec的安装和使用
zhangyangzhi: 新版的怎么查看架构信息呀
PWN-最新checksec的安装和使用
yr_w10: 您好，按照博客内容操作后不报连接层数过多的错误，checksec也放到了相应目录下，但是提示checksec: command not found，该怎么弄呢
线性筛选法求素数
纯情程序猿: 原理：素数的倍数一定不是素数。这个代码有点问题吧应该是这样写的吧 ```c for(int j = i*2;j <= n;j += i){ check[j] = 1; } ```
究极pwntools环境配置，ubuntu下anaconda管理python
youngmith: 作者大大，我用pwntools的asm（shellcraft.sh())的时候一直再给我报错，单用asm这个函数的时候又不会报错，只有shellcraft会报错，请问是为什么呀
Git使用总结
程序猿学长: 加油

大家在看

MongoDB数据库命令

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。