
Hadoop
zc02051126
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Hadoop权威指南-读书笔记
第2章 关于MapReduce 2.1 Hadoop集群架构 图 2.1 Hadoop集群架构图 在图2.1中包括分布式数据处理模型MapReduce,分布式文件系统HDFS。 2.1.1 MapReduce模型之Job与Nodes Ø 一个job由若干task组成: l 若干 map tasks l 若干 reduce tasks Ø 控制jo原创 2013-02-18 09:30:02 · 1700 阅读 · 0 评论 -
Hadoop基本使用
1、删除output路径所在的文件 HadoopUtil.delete(conf, output); 2、获取HDFS上某一路径下的所有文件 2.1 方法1 FileSystem hdfs = null; try { //hdfs = FileSystem.get(URI.create("hdfs://localhost:9000/"),conf); hdfs = FileSyste原创 2013-04-07 14:15:38 · 1123 阅读 · 0 评论 -
Hive UDF函数
hive的0.7版本没有row_number函数,在http://www.cnblogs.com/ggjucheng/archive/2013/01/30/2868993.html 上找了一段RowNumber.javapackage com.blue.hive.udf; import org.apache.hadoop.hive.ql.exec.UDF; public class RowNumbe原创 2015-09-22 11:17:47 · 1684 阅读 · 0 评论