Hadoop
文章平均质量分 90
hadoop内容整理
_keep_doing
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop学习 前置章节 环境
1原创 2024-07-17 22:00:51 · 945 阅读 · 0 评论 -
Hadoop学习 第四章 Hive
如果让您设计Hive这款软件,要求能够实现1.用户只编写sql语句2.Hive自动将sql转换MapReduce程序并提交运行3.处理位于HDFS上的结构化数据。如何实现?原创 2024-11-09 17:03:36 · 1276 阅读 · 0 评论 -
Hadoop学习 第二章 HDFS
1. 什么是HDFS?HDFS全称:Hadoop Distributed File System是Hadoop三大组件(HDFS、MapReduce、YARN)之一可在多台服务器上构建集群,提供分布式数据存储能力2. HDFS中的架构角色有哪些?NameNode:主角色,管理HDFS集群和DataNode角色DataNode:从角色,负责数据的存储SecondaryNameNode:辅助角色,协助NameNode整理元数据。原创 2024-11-09 17:00:58 · 1658 阅读 · 0 评论 -
Hadoop学习 第三章 分布式计算和分布式资源调度
1. 什么是计算、分布式计算?•计算:对数据进行处理,使用统计分析等手段得到需要的结果•分布式计算:多台服务器协同工作,共同完成一个计算任务2. 分布式计算常见的2种工作模式•分散->汇总 (MapReduce就是这种模式)•中心调度->步骤执行 (大数据体系的Spark、Flink等是这种模式)MapReduce概述MapReduce是“分散->汇总”模式的分布式计算框架,可供开发人员开发相关程序进行分布式数据计算。MapReduce提供了2个编程接口:•Map•Reduce其中。原创 2024-11-09 17:02:15 · 1182 阅读 · 0 评论 -
Hadoop学习--第一章 Hello大数据分布式
从海量的高增长、多类别、低信息密度的数据中挖掘出高质量的结果可以实现大数据核心工作的存储和计算(另一个是传输)原创 2024-11-09 16:58:24 · 487 阅读 · 0 评论
分享