
Hadoop 系列
文章平均质量分 96
Hadoop 系列
老猫喜欢今日爬山
不积跬步无以至千里
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop 之分布式计算框架MapReduce
1.1 MapReduce定义MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。1.2MapReduce优缺点1.21优点1MapReduce易于编程它简单的实现一些接口,就可以完成一个分布式程序,这个分布式程序可以分布到大量廉价的PC机器上运行。原创 2024-02-04 16:06:03 · 1549 阅读 · 0 评论 -
Hadoop 之分布式文件系统HDFS
HDFS产生背景随着数据量越来越大,在一个操作系统存不下所有的数据,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。HDFS定义HDFS),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。HDFS的使用场景:适合一次写入,多次读出的场景。原创 2024-02-02 16:32:16 · 1445 阅读 · 0 评论 -
Hadoop 环境搭建
1各个模块分开启动/停止(配置ssh是前提)常用(1)整体启动/停止HDFS(2)整体启动/停止YARN2各个服务组件逐一启动/停止(1)分别启动/停止HDFS组件(2)启动/停止YARN。原创 2024-02-01 17:53:20 · 1893 阅读 · 0 评论