
大数据框架
Jeff_Scott
Less is more
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Flink学习总结
本文为学习B站上的Flink入门视频课程的总结,有些重点知识或许在面试中会被问到,故于此分享学习。 1.Flink和Storm,Hadoop,Spark的对比? Hadoop是纯粹的批处理框架,storm是纯粹的流处理框架,spark通过基于两种不同的技术实现了批处理和流处理,但是Flink同时支持实现了批处理和流处理,将批处理作为一种特殊的流处理。 Storm:延迟低,能做到毫秒级,牺牲了...原创 2019-07-13 20:52:45 · 1307 阅读 · 0 评论 -
Kafka入门笔记
0.本笔记是在学习B站上尚硅谷视频教程的重点笔记,有些可能在面试中问到,故于此记录。 1.消息队列内部实现原理 消息队列的优点: 1)解耦 2)冗余 3)扩展性 4)灵活性,峰值处理 5)可恢复性 6)顺序保证 7)缓冲 8)异步通信 2.请简单说一下消息队列两种模式的优缺点 消息队列有点对点模式(一对一,消费者主动拉取数据,消息收到后消息消除),发布/订阅模式(...原创 2019-07-26 00:50:27 · 208 阅读 · 0 评论 -
大数据整理
Table of Contents 0.良心总结 1.Hadoop 1.0 良心总结 1.1 HDFS读写流程 1.2 Mapreduced架构及通信 1.3 Shuffle过程 1.4 YARN架构组成 1.5 Hadoop2有哪些改进? 1.6 Mapreduce的容错性是怎样实现的? 1.7 实操性测试 1.8 写数据的时候Datanode怎么知道将数据写到哪? ...原创 2019-09-22 11:25:05 · 1400 阅读 · 0 评论 -
Ubuntu下Hadoop搭建
Table of Contents 0.环境说明 1. Java安装 2.Hadoop 安装 2.1 新建hd用户 2.2伪分布式模式安装 2.2.1 移动文件 2.2.2 Hadoop配置 2.2.3 Hadoop测试 2.3 Hadoop集群模式的安装 2.3.1 添加环境变量 2.3.2 配置环境文件 2.3.3 修改主机名 2.3.4设置 SS...原创 2019-10-03 12:01:49 · 337 阅读 · 0 评论