
Hadoop
文章平均质量分 74
bigface1234fdfg
贴在地上过日子,有个好处就是,摔也摔不到哪儿去。
展开
-
如何在Centos下安装hadoop并与Eclipse连接?
整个教程分为这样5个部分来说:1)在Windows下安装虚拟机Vmware,并新建一个虚拟机装好centos系统;2)centos下设置ssh服务无密码登录;3)centos下安装jdk,并配置环境变量;4)centos下安装hadoop,并配置文件;5)windows下安装jdk和eclipse,并将eclipse与centos下的hadoop连接。可以说这5个部分每一个都很重要,尤其是第4)步。下面我们就详细说一下每一步该怎么做。原创 2014-11-18 14:37:54 · 3510 阅读 · 0 评论 -
入门Hadoop的WordCount程序
本篇文章主要说两部分:简单介绍MapReduce的工作原理;详细解释WordCount程序。原创 2014-11-19 10:46:42 · 1679 阅读 · 0 评论 -
Hadoop中HDFS的存储机制
HDFS(Hadoop Distributed File System)是Hadoop分布式计算中的数据存储系统,是基于流数据模式访问和处理超大文件的需求而开发的。下面我们首先介绍HDFS中的一些基础概念,然后介绍HDFS中读写操作的过程,最后分析了HDFS的优缺点。原创 2014-12-02 13:40:59 · 4216 阅读 · 0 评论 -
再理解HDFS的存储机制
再理解HDFS的存储机制 1. HDFS开创性地设计出一套文件存储方式,即对文件分割后分别存放;2. HDFS将要存储的大文件进行分割,分割后存放在既定的存储块(Block)中,并通过预先设定的优化处理,模式对存储的数据进行预处理,从而解决了大文件储存与计算的需求;3. 一个HDFS集群包括两大部分,即NameNode与DataNode。一般来说,一个集群中会有一个NameNode和多个DataNode共同工作;4. NameNode是集群的主服务器,主要是用于对HDFS中所有的文件及原创 2014-12-15 09:03:55 · 3229 阅读 · 0 评论 -
HDFS中的命令行
HDFS中的命令行 本文介绍了HDFS以命令行运行的时候,几个常用的命令行的作用和如何使用~1. fsfs是启动命令行动作,该命令用于提供一系列子命令。使用形式为hadoop fs –cmd <args>其中,cmd是子命令,args是具体的命令操作。例如hadoop fs –help或者说fs是其余子命令的父亲,其余都是在“-cmd”的模式下的!原创 2014-12-15 10:00:24 · 1597 阅读 · 0 评论