
hadoop
文章平均质量分 61
飞鸟zjs
这个作者很懒,什么都没留下…
展开
-
Unable to load native-hadoop library for your platform... using builtin-java classes where applicab
出现上述问题主要是环境变量没设置好,在~/.bash_profile或者/etc/profile中加入以下语句就没问题了。 #vi /etc/profile或者vi ~/.bash_profile export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export HADOOP_OPTS="-Djava原创 2015-08-14 13:03:43 · 808 阅读 · 0 评论 -
Hadoop 调试第一个MapReduce程序过程详细记录总结
开发环境搭建参考 Hadoop 在Windows7操作系统下使用Eclipse来搭建Hadoop开发环境>: http://www.linuxidc.com/Linux/2014-12/111061.htm1,程序代码如下:package wc;import java.io.IOException;import java.util.StringTokenizer;转载 2015-08-17 19:36:19 · 982 阅读 · 0 评论 -
Hadoop中合并小文件
问题?每一个比block size小的文件都会消耗掉一个完整block的分配,但是磁盘空间的实际占用是基于文件的大小,而不要误认为小文件会消耗掉一整个块的存储空间。每个块都会消耗NameNode节点一定数量的内存。NameNode能够寻址固定数量的块个数,这需要视NameNode节点的内存大小而定。在Hadoop集群上的这些小文件会不断触及NameNode节点的内存转载 2015-09-01 16:15:03 · 6721 阅读 · 0 评论 -
MapReduce 查询mysql表中的数据,打印记录数,并转储回mysql表
package com.laoxiao.mr02;import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import java.sql.PreparedStatement;import java.sql.ResultSet;import java.sql.SQLEx原创 2015-08-19 20:35:02 · 572 阅读 · 0 评论 -
mapreduce查询mysql表中记录数
package com.zjs.mr2;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.In原创 2015-08-20 21:02:30 · 492 阅读 · 0 评论 -
MapReducer实现单词计算
package com.zjs.mr;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Tex原创 2015-08-20 13:47:50 · 559 阅读 · 0 评论 -
Mapreducer天气排序,分区,分组,排序
package com.zjs.mr2;import java.io.IOException;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import org.apache.hadoop.conf.Configuration;import org.apache.h原创 2015-08-20 16:48:53 · 1440 阅读 · 0 评论 -
MapReduce 二级排序
在这篇文章里,我们将继续实现《利用MapReduce玩转数据密集型文本处理》这本书中提到的算法。本系列的其它文章如下:利用MapReduce实现数据密集型文本处理利用MapReduce实现数据密集型文本处理 - 本地汇聚第二部分利用MapReduce实现共生矩阵(译者注: 共生矩阵,Co-Occurrence Matrix,见Wikipedia或百度)MapReduce算法 -转载 2015-09-08 18:28:27 · 564 阅读 · 0 评论 -
Hadoop安装配置
1、集群部署介绍 1.1 Hadoop简介 Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。 对于Had转载 2015-09-08 15:20:30 · 603 阅读 · 0 评论