
hadoop
阴天快乐、、
这个作者很懒,什么都没留下…
展开
-
大数据相关知识点
HDFS:高度容错的适合部署在廉价机器上的分布式系统,提供高吞吐量的数据访问,非常适合大规模数据上的应用。由于放宽了一部分POSIX约束,从而实现了流式读取文件系统数据。MapReduce:一种编程模式,用于大规模数据集的并行计算。map函数:接受一个键值对(key-value pair),产生一组中间键值对。MapReduce框架会将map函数产生的中间键值对里键相同的值传递给一个reduce函数。reduce函数:接受一个键,以及相关的一组值,将这组值进行合并产生一组规模更小的值(通常只有一个或零原创 2021-03-26 22:08:37 · 353 阅读 · 0 评论 -
Hadoop MapReduce 简单案例--求平均值
代码:import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.LongWritable; im原创 2017-09-22 21:53:58 · 877 阅读 · 0 评论 -
Hadoop MapReduce 简单案例--求素数个数
package test;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;imp原创 2017-09-24 20:53:11 · 992 阅读 · 0 评论 -
hadoop 错误提示 解决范围
在hadoop向云端传入文件时hadoop@hadoop1:~$ hadoop fs -mkdir inputhadoop@hadoop1:~$ hadoop fs -put input/* input显示:hadoop@hadoop1:~$ hadoop fs -mkdir inputhadoop@hadoop1:~$ hadoop fs -put input/* in原创 2017-08-30 19:42:12 · 1343 阅读 · 0 评论 -
Hadoop 伪分布式配置(一).配置jdk
一.配置jdk1.由于hadoop是用java语言编写的,所以第一步我们需要安装JDK 首先下载jdk 下载地址:官方下载地址http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html根据系统选择32位或是64位jdk这里我的系统式64位的,所以点下面的红框里的下载即可点击确定即可2.下载...原创 2018-06-15 20:01:59 · 569 阅读 · 0 评论 -
Hadoop 伪分布式配置(二).配置hadoop
1.首先下载hadoop(版本1.2.1)下载地址:http://hadoop.apache.org/releases.html2. 配置hadoop的配置文件对于hadoop到三种运行模式都需要配置jdk路径,所以首先介绍这个到配置进入conf文件夹下,在hadoop-env.sh文件中做修改,在第九行左右到位置中有#exportJAVA_HOME=*******这样到字样,首先将#(这里#为注...原创 2018-06-15 20:30:27 · 345 阅读 · 0 评论