
hadoop
文章平均质量分 97
妍妍的宝贝
好的好的
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
hadoop词频统计
此文章基于搭建好hadoop之后做的词频统计实验,以上是链接。原创 2024-06-30 17:10:23 · 6656 阅读 · 1 评论 -
Hadoop 安装与伪分布的搭建
在Hadoop生态系统中,YARN(Yet Another Resource Negotiator)是一个通用的资源管理系统,它不仅可以管理MapReduce作业,还可以支持其他类型的计算框架。Secondary NameNode并不存储集群的实时状态,但它定期合并NameNode的fsimage和editlogs文件,减少NameNode的启动时间。在生产环境中,这通常是不推荐的做法,因为如果存储数据的节点出现故障,数据可能会丢失。DataNodes存储实际的数据块,是HDFS数据存储的主要组成部分。原创 2024-06-29 16:33:13 · 1570 阅读 · 1 评论