
MapReduce
lds_include
在职人员
展开
-
MapReduce自定义数据类型
MapReduce自定义数据类型原因首先我们要将自己定义的类进行MapReduce计算的时候自定义数据类型就有了它存在的必要性,自定数据类型还可以实现二次排序,自定义数据类型扩大了数据在MapReduce之间传输的局限性。做法需要在自定义的类上实现Hadoop规则的数据序列化,如果有必要的话要重新定义这个类的比较规则,因为这些数据要在不同主机上进行传输,想要实现传输那么就得必须实现它...原创 2019-03-20 21:51:28 · 366 阅读 · 1 评论 -
MapReduce自定义分区器partitioner
MapReduce自定义分区器partitionerMapReduce自带分区器源码讲解源码import org.apache.hadoop.classification.InterfaceAudience;import org.apache.hadoop.classification.InterfaceStability;import org.apache.hadoop.mapredu...原创 2019-03-21 13:14:41 · 375 阅读 · 0 评论 -
MapReduce定义、功能和详细执行过程的理论
MapReduce理论知识解释:MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)“和"Reduce(归约)”,是它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新...原创 2019-03-18 11:00:30 · 424 阅读 · 0 评论 -
MapReduce创建mapper、reducer、驱动器driver
MapReduce代码MapReduce编写例子:求记录一个文件中的每个单词的个数文件1.txt--------------------java c c++ c# python hadoop hive scala sparkjava c c++ c# python hadoop hive scala sparkjava c c++ c# python hadoop hiv...原创 2019-03-18 12:20:13 · 680 阅读 · 0 评论 -
mapreduce的自定义输入格式
mapreduce自定义输入格式概念:当普通的输入格不能满足客户的要求的时候。因为普通的输入格式是将文件的每一行输入的数据作为一个value值然后进行map端的操作。现在有的需求是将数据库中的数据作为一个输入的格式,或者是将一个文件的整体作为一个输入格式等。举例:现在有一个需求是将一个目录下的所有小文件读取进来,将文件的整个内容都作为一个value值进行输入。出来map端的值是文件名...原创 2019-06-21 14:59:40 · 595 阅读 · 1 评论 -
mapreduce的自定义输出格式
mapreduce自定义输出格式概念:当普通的输出格式不能满足客户的要求的时候。因为普通的输出格式是将结果直接输出到一个单一的文件中去。现在有的需求是将处理的结果输出到数据库中,或者是将结果按照不同的需求输出到不同的文件中去。举例:现在有一个需求是将一个文件读取进来后,然后判断文件中的被切割的字符串是否含有要求的字符串,如果有的话就输出到对应的文件中去。源码解析:源码pu...原创 2019-06-21 16:59:11 · 805 阅读 · 0 评论 -
mapreduce的自定义分组器
Mapreduce自定义分组器前提:有的时候我们想将符合条件的key值放在同一个组内;但是key的值是不同的将不会放进同一个组中。举例:想将一个学生的进校以后不同时间段的数学成绩按进校考试的时间进行一个成绩排序。如下效果//排序前的效果 stu1 time1 core1 stu1 time2 core stu1 time3 core3 stu2 time1 core1 stu2 t...原创 2019-06-18 17:55:50 · 846 阅读 · 1 评论 -
mapreduce的map端的分布式缓存
mapreduce的map端的分布式缓存必要性:有的时候我们需要完成一些类似于数据库的两表join的效果,这个时候就能够通过将其中的一个表提前加载到map中来,这个时候有了将一张表的数据缓存到内存中来,方便map的快速读取。这里有两种方法可以实现这个效果,下面就一个一个讲解。注意:想要将表缓存进内存中,那么表的大小不能够超过缓存的大小,否则就会造成数据溢出,影响数据的准确性。步骤:1...原创 2019-06-23 12:49:39 · 482 阅读 · 0 评论