
mapreduce
lingzhiwangcn
这个作者很懒,什么都没留下…
展开
-
.gz文件上载到hdfs中
.gz文件上载到hdfs中用 dfs -copyFormLocal的方式,上载后的文件正常,可以用mapreduce直接读取;用flume的方式,datastream类型,上载后mapreduce操作异常,为何呢?Error: java.io.EOFException: Unexpected end of input stream at org.apache.hadoop.i原创 2016-01-18 15:06:22 · 1834 阅读 · 4 评论 -
MapReduce一次性读取小文件全部内容(压缩和非压缩),文件名作key
/**Text缺省的最大到1024*1024,也就是1MB*/public class SmallFileRecordReader extends RecordReader{ private static final Log LOG = LogFactory.getLog(WholeFileRecordReader.class); private Fi原创 2016-01-21 15:59:23 · 682 阅读 · 0 评论 -
MapReduce传递文件内容到map中使用
Job中配置:String Info_inConfigDir = "hdfs://localhost:9000/cps/conf/FileReport"; Path filePath = new Path(Info_inConfigDir); job.addCacheFile(filePath.toUri());//mapper start原创 2016-01-29 14:43:50 · 608 阅读 · 0 评论