Hadoop
程序员大魔王
努力学大数据的小菜鸟
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
BigData5:Hadoop之HDFS的Edits和Fsimage文件
Edits相关知识当执行格式化指令时,会在指定的tmp目录下,生成dfs/name目录。此目录是namenode服务器存储元数据的目录当格式化后,启动HFDS前,会生成一个最初的fsimage_0000000000000000000文件在 dfs/data目录,这是datanode节点存储数据块的目录。元数据的存储目录和数据节点的目录的路径可以分开指定在dfs/name/in_use...原创 2020-02-14 00:03:00 · 1632 阅读 · 0 评论 -
Bug0:解决Hadoop插件运行时遇到java.io.FileNotFoundException错误
问题描述在Eclipse中用插件(而不是手动打包上传服务器方式)运行WordCount程序的过程中出现了如下错误:DEBUG - LocalFetcher 1 going to fetch: attempt_local938878567_0001_m_000000_0 WARN - job_local938878567_0001java.lang.Exception: org.apache...原创 2020-02-12 19:37:46 · 1919 阅读 · 0 评论 -
BigData7:Hadoop之HDFS的租约锁机制和特点总结
租约锁HDFS的有个内部机制:不允许客户端的并行写。指的是同一时刻内,不允许多个客户端向一个HDFS上写数据。所以要实现以上的机制,实现思路就是用互斥锁,但是如果底层要是用简单的互斥锁,可能有与网络问题,造成客户端不释放锁,而造成死锁。所以Hadoop为了避免这种情况产生,引入租约机制。租约锁本质上就是一个带有租期的互斥锁。Hadoop的思想来自于Google的论文,3.1Hadoop...原创 2020-02-11 14:38:44 · 2212 阅读 · 0 评论 -
BigData6:Hadoop之图解HDFS上传下载文件相关流程
HDFS架构图1)namnode,名字节点,最主要管理HDFS的元数据信息2)datanode,数据节点,存储文件块3)replication,文件块的副本,目的是确保数据存储的可靠性4)rack 机器5)Client 客户端。凡是通过指令或代码操作的一端都是客户端6)Client 的Read(从HDFS下载文件到本地)7)Client的Write(上传文件到HDFS上)从HD...原创 2020-02-11 12:42:35 · 1337 阅读 · 0 评论 -
BigData4:Hadoop之HDFS的回收站机制
补充一个知识点Hadoop回收站trash,默认是关闭的。修改conf/core-site.xml,增加配置示例:<property> <name>fs.trash.interval</name> <value>1440</value> <description>Number of minutes betw...原创 2020-02-10 15:30:18 · 1103 阅读 · 0 评论 -
BigData3:Hadoop之伪分布式安装部署
各种部署方式及特点单机模式:不能使用HDFS,只能使用MapReduce,所以单机模式最主要的目的是在本机调试MapReduce代码伪分布式模式:用多个线程模拟多台真实机器,即模拟真正的分布式环境完全分布式:用多台机器(或启动多个虚拟机)来完成部署集群这里先用伪分布式来进行练习,仅用一台虚拟机安装步骤如下关闭防火墙 #执行: service iptables stop ...原创 2020-02-10 14:30:24 · 1069 阅读 · 0 评论 -
BigData2:Hadoop之HDFS核心技术解析
HDFS介绍起初,随着数据量的越来越大,通过纵向扩展(在一台机器中加磁盘)的形式已经不能满足需要,所以开始横向扩展(用多台机器进行数据存储)。为了方便管理和维护,分布式文件存储管理系统应运而生,HDFS就是其中之一。HDFS架构原理架构图如下图所示分布式文件系统的存储特点:切块存储HDFS主要由两部分组成namenodedatanodenamenode主要是用来管理整个分...原创 2020-02-09 18:58:32 · 1394 阅读 · 0 评论 -
BigData1:初识Hadoop
Apache的Hadoop是一个开源的、可靠的、可扩展的系统架构,可利用分布式架构来存储海量数据、以及实现分布式的计算。Hadoop的两个作用存储海量数据计算海量数据Hadoop应用场景做网页内容的分析处理做用户访问行为的分析处理,可以借此建立用户画像用户推荐系统的数据分析和处理在线广告的点击分析和流量分析Hadoop的框架最核心的设计就是:HDFS和MapReduce。...原创 2020-02-09 16:51:29 · 1055 阅读 · 0 评论
分享