
Hadoop开发
文章平均质量分 89
飞向Hadoop
这个作者很懒,什么都没留下…
展开
-
精通HADOOP(五) - 初识Hadoop - 执行和测试Hadoop样例程序
1.1 执行和测试Hadoop样例程序在Hadoop安装目录中你会找到包含Hadoop样例程序的JAR文件,你可以用它来试用Hadoop。在你执行这些样例程序以前,你应该保证你的安装是完全的和你的执行时环境的设置是正确的。我们在前面小节中提到,check_basic_env.sh脚本能够帮助你校验安装,如果安装有任何错误,它会提示你改正。 1.1.1 Hadoop的样例代码转载 2014-11-15 16:30:04 · 719 阅读 · 0 评论 -
MapReduce多表关联实验
一、实例描述多表关联是通过对原始数据进行一定的处理,从其中挖掘出关心的信息。 二、数据描述输入是两个文件,一个代表工厂表,包含工厂名列和地址号列;另一个代表地址表,包含地址名列和地址编号列。要求从输入数据中找出工厂名和地址名的对应关系,输出工厂名---地址名表。 样例输入:Factory:原创 2014-11-18 15:28:04 · 2507 阅读 · 0 评论 -
MapReduce单表关联实验
一、实验内容单表关联这个实例要求从给出的数据中寻找出所关心的数据,它是对原始数据包含信息的挖掘。 二、实例描述实例中给出child-parent表,要求输出grandchild-grandparent表。 样例的输入: child parentTom原创 2014-11-17 17:04:02 · 932 阅读 · 0 评论 -
MapReduce数据去重程序实验
一、实验目的数据去重实验原创 2014-11-16 16:14:15 · 2304 阅读 · 0 评论 -
MapReduce数据排序实验
一、实验目的数据排序是许多实际任务在执行时要完成的一项工作,比如学生成绩评比、数据建议索引等。先对原始数据进行初步处理,为进一步的数据操作打好基础。 二、实例描述对输入文件中的数据进行排序。输入文件中的每行内容均为一个数字,即一个数据。要求在输出中每行有两个间隔的数字,其中,第二个数字代表原始数据,第一个数字代表这个原始数据在原始数据集中的位次。 样例输入:file1:原创 2014-11-17 15:43:07 · 3936 阅读 · 0 评论 -
hadoop 倒排索引
[java] view plaincopy倒排索引是文档检索系统中最常用的数据结构,被广泛的应用于全文搜索引擎。它主要用来存储某个单词(或词组),在一个文档或一组文档中的存储位置的映射,即提供了一种根据内容来查找文档的方式,由于不是根据文档来确定文档所包含的内容,而是进行了相反的操作,因而被称为倒排索引。 [java] view plain转载 2014-11-16 11:06:45 · 532 阅读 · 0 评论 -
Hadoop 双机热备-AvatarNode部署
Hadoop 双机热备--AvatarNode部署部署环境虚拟机5台(1G内存,40G硬盘,ubuntu操作系统,Hadoop-0.20.2)hadoop1-virtual-machine 10.10.11.250 AvatarNode(primary)hadoop2-virtual-machine 10.10.11.152 AvataDataNode转载 2014-11-16 11:47:51 · 534 阅读 · 0 评论 -
如何制作私人网盘---利用hadoop如何制作网盘指导
网盘是由rest api来实现的,很多不熟悉,所以这里借用Java api来伪实现以下,只要换成api就可以了。REST可参考:hadoop、openstack web编程必读:什么是REST----RESTful架构起源及讲解1.网盘如何与Javaweb相结合作为云技术爱好者,我们都知道网盘。当然如果非云技术爱好者,也都知道网盘:百度网盘,360网盘等。有一点不同的是,我转载 2014-11-16 11:41:54 · 4813 阅读 · 0 评论 -
使用Hadoop打造私有云盘之API操作
项目介绍:使用hadoop实现云盘的增删读获取列表功能,hadoop不支持数据修改,特性是一次写入多次读取。主流的网盘也不支持该功能。今天我们用hdfs的FileSystem实现这些操作。1、上传功能指定文件的本地路径和hdfs存储路径,通过hadoop提供的IOUtils工具类将流写入到hdfs中。2、下载功能指定要访问的hdfs中的文件路径,使用FileSyst转载 2014-11-16 11:40:30 · 653 阅读 · 0 评论 -
Hadoop 集群常见错误
(一)启动hadoop集群时易出现的错误:1. 错误现象:java.net.NoRouteToHostException: No route to host. 原因:master服务器上的防火墙没有关闭。 解决方法: 在master上关闭防火墙: chkconfig iptables off.2. 错误现象:org.转载 2014-11-15 16:28:50 · 572 阅读 · 0 评论 -
hadoop2.x常用端口及定义方法(方便以后查询)
问题导读:1.DataNode的http服务的端口、ipc服务的端口分别是哪个?2.NameNode的http服务的端口、ipc服务的端口分别是哪个?3.journalnode的http服务的端口、ipc服务的端口分别是哪个?4.ResourceManager的http服务端口是哪个?5.NodeManager的http服务端口是哪个?6.Maste转载 2014-11-16 11:28:54 · 813 阅读 · 0 评论 -
通过MapReduce程序来实现计算学生平均成绩
一、简介:此程序主要是实现一个计算学生平均成绩的原创 2014-11-15 15:33:04 · 10934 阅读 · 1 评论 -
hadoop-1.2.0集群安装与配置
硬件环境1、windows 7 旗舰版 64位2、VMware Workstation ACE 版 6.0.23、Redhat Linux 54、Hadoop-1.2.0WindowsVM[url=]虚拟机器Linux[/url]IP作用Window 7 64位VMware转载 2014-11-16 11:49:33 · 481 阅读 · 0 评论 -
Hadoop云盘系统
总体概况 项目名称: 《Hadoop云盘系统》 Ø 项目开发环境:Linux下Hadoop分布式系统Ø 项目开发环境:Ubuntu11.04+Hadoop0.20.2+JDK1.6+Eclipse3.3.2。Ø 使用技术:Hadoop + JavaØ 作品展示地址:http://blog.youkuaiyun.com/jtlyuan/ar转载 2014-11-16 11:07:56 · 3643 阅读 · 1 评论 -
hadoop集群配置datanode无法启动的原因
当启动hadoop时,用jps命令查看进程是datanode没有启动,而其他的都正常,查看日志显示如上的内容,解决方案 删除所用的tmp文件夹然后执行hadoop namenode -format 进行格式化,在重新启动start-all.sh就都好了还有个问题就是有防火墙,关闭防火墙原创 2015-08-31 18:08:37 · 558 阅读 · 0 评论