Hadoop
文章平均质量分 93
BUG_GUB
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Hadoop笔记_4】项目案例实战
由于文章太长,其余部分在我的其他几篇博客中!第一部分:Hadoop介绍及安装第二部分:HDFS第四部分:MapReduce6、基于Web日志数据处理的网站KPI分析系统项目分析资料链接:https://pan.baidu.com/s/1sn9uRWi3Rhl4GL4g04Tv5w 提取码:zidg6.1 项目开发流程6.2 项目任务6.2.1 合并小文件说明:由于在网络上挖掘下来的数据可能不止一个文件,而对每一个小文件进行MapReduce分析则需要分成等.原创 2021-04-26 22:04:04 · 5561 阅读 · 0 评论 -
【Hadoop笔记_3】MapReduce、案例分析、实例分析代码
由于文章太长,其余部分在我的其他几篇博客中!第一部分第二部分5、MapReduce5.1_简介MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个Hadoop集群上。5.2_MapReduce的优缺点优点MapReduce易编程它简单的实现一些接口,就可以完成一个分布式程序,这个分布式程序可以分布到大量.原创 2021-04-26 21:51:22 · 10784 阅读 · 1 评论 -
【Hadoop笔记_2】HDFS、项目实例、实例分析
由于文章太长,第一部分在我的另外一篇博客中4、HDFSHDFS作用:进行分布式的存储HDFS(Hadoop Distributed File System),是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能,集中的服务器有各目的角色。HDFS的使用场景:适合一次写入,多次读出的场景,且不支持文件的修改。适合用来做数据分析,并不适合用来做网盘应用。4.1_HDFS的整体架构[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上.原创 2021-04-26 21:21:34 · 2849 阅读 · 0 评论 -
【Hadoop笔记_1】Hadoop介绍及安装
《Hadoop》Hadoop常用命令命令说明jps查看进程service iptables stop关闭防火墙start-all.sh启动Hadoop服务1、Hadoop介绍Hadoop是使用Java编写,允许分布在集群,使用简单的编程模型的计算机大型数据集处理的Apache的开源框架。 Hadoop框架应用工程提供跨计算机集群的分布式存储和计算的环境。 Hadoop是专为从单一服务器到上千台机器扩展,每个机器都可以提供本地计算和存储1.1 Hado原创 2021-04-26 21:11:58 · 1133 阅读 · 0 评论 -
【combiner使用及错误】案例分析
一、Combiner说明 MapReduce中的Combiner是为了避免map任务和reduce任务之间的数据传输而设置的。Hadoop允许用户针对maptask的输出指定一个合并函数。即为了减少传输到Reduce中的数据量。它主要是为了削减Mapper的输出从而减少网络带宽和Reducer之上的负载。Combiner和Reducer的区别Combiner和Reducer的区别在于运行的位置:Combiner是在每一个MapTask所在的节点运行,Reducer是接收全局所有Mapper的输出原创 2021-04-12 22:25:39 · 1051 阅读 · 0 评论
分享