Z_Data的博客

专注大数据知识分享

Java

关注

文章平均质量分 96

java 相关

关注数：文章数：30 文章阅读量：24464 文章收藏量：210

作者: Z_Data

大学计算机专业老师一枚，高级开发工程师，专注大数据相关技术分享，实战项目开发。

展开

面向对象程序设计——第3章案例

用户通过键盘输入一个整数值，判断该数值是否为“水仙花数”。“水仙花数”是指一个3位数，其各位数的三次方和等于该数本身。例如：水仙花例如: 153是一个“水仙花数”，因为本案例程序运行的结果如图本案例的实现过程应满足以下要求。

原创 2024-08-06 16:57:35 · 1230 阅读 · 0 评论
面向对象程序设计——单元3 流程控制与数组

程序设计的流程控制主要包括3种结构：顺序结构、选择结构和循环结构。其中，选择结构根据给定条件的判断结果来控制程序的流程，而循环结构可以减少重复书写代码的工作量，用来描述重复执行某段算法的问题，这是程序设计中最能发挥计算机特长的程序结构。优良的程序控制结构需要和合适的数据组织形式搭配使用，才能提升程序的运行效能，数组就是一种最常用的数据组织结构。本单元将介绍Java灵活、高效的选择结构、循环结构以及Java独特的数组结构。

原创 2024-08-06 11:07:50 · 623 阅读 · 0 评论
面向对象程序设计——单元2 Java语言基础

构成程序的最基本元素包括变量、常量和语句等。变量是指程序运行过程中其值可以被改变的量，比如表示不同班级学生平均成绩的变量；常量则是指程序运过程中，值不会发生变化的量，比如最常见的圆周率。无论是变量还是常量，在使用之前都要先为它们指定一个名字。而语句则是组成一段程序的最基本单元。本单元主要介绍 Java 的基本语法，包括标识符、保留字、变量、常量、数据类型、运算符和表达式等。

原创 2024-07-05 16:35:18 · 730 阅读 · 0 评论
面向对象程序设计——Java语言基础

构成程序的最基本元素包括变量、常量和语句等。变量是指程序运行过程中其值可以被改变的量，比如表示不同班级学生平均成绩的变量；常量则是指程序运过程中，值不会发生变化的量，比如最常见的圆周率。无论是变量还是常量，在使用之前都要先为它们指定一个名字。而语句则是组成一段程序的最基本单元。

原创 2024-06-25 13:57:58 · 973 阅读 · 0 评论
搭建Java开发环境

JDK 基本介绍JDK 的全称(Java Development Kit Java 开发工具包)JDK = JRE + java 的开发工具 [java, javac,javadoc,javap 等]JDK 是提供给 Java 开发人员使用的，其中包含了 java 的开发工具，也包括了 JRE。所以安装了 JDK，就不用在单独安装 JRE 了。JRE 基本介绍JRE(Java Runtime Environment Java 运行环境)JRE = JVM + Java 的核心类库[类]

原创 2024-04-17 15:41:23 · 1154 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ------ 获取文件名

在map运行时获取被处理数据所在文件的文件名import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io....

原创 2018-11-09 08:53:19 · 372 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ---------- 多文件输出

将MR处理后的结果数据输出到多个文件中import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Pa...

原创 2018-11-09 08:53:08 · 293 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ---------------- partition分区

Mapreduce中会将map输出的kv对，按照相同key分组，然后分发给不同的reducetask默认的分发规则为：根据key的hashcode%reducetask数来分发，所以：如果要按照我们自己的需求进行分组，则需要改写数据分发（分组）组件Partitioner。自定义一个CustomPartitioner继承抽象类：Partitioner 然后在job对象中，设置自定义...

原创 2018-11-09 08:52:58 · 607 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ------------- 去除重复

去除文件中重复的行import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.LongWritable;...

原创 2018-11-09 08:53:29 · 1151 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 -------- 过滤敏感词汇

一篇文章 article.txt 内容如下：We ask that you please do not send us emails privately asking for support. We are non-paid volunteers who help out with the project and we do not necessarily have the time o...

原创 2018-11-09 08:53:40 · 1551 阅读 · 1 评论
结合案例讲解MapReduce重要知识点 ---------- Combiner

combiner是MR程序中Mapper和Reducer之外的一种组件 combiner组件的父类就是Reducer combiner和reducer的区别在于运行的位置： Combiner是在每一个maptask所在的节点运行 Reducer是接收全局所有Mapper的输出结果； combiner的意义就是对每一个maptask的输出进行...

原创 2018-11-09 08:53:49 · 280 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ----------- 倒排序

需求：文章及其内容： index.html : hadoop is good hadoop hadoop is ok page.html : hadoop has hbase hbase is good hbase and hive content.html : hadoop spark hbase are good ok输出： and page.html:1 are content...

原创 2018-11-09 08:53:58 · 762 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 --------- 简单排序

import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org....

原创 2018-11-10 08:49:41 · 234 阅读 · 0 评论
2018年终巨献：阿里、腾讯最新Java面试题，你准备好进BAT了吗？

Java高级互联网架构 Java基础1.进程和线程的区别；2.Java的并发、多线程、线程模型；3.什么是线程池，如何使用?4.数据一致性如何保证；Synchronized关键字，类锁，方法锁，重入锁；5.Java中实现多态的机制是什么；6.如何将一个Java对象序列化到文件里；7.说说你对Java反射的理解；8.同步的方法；多进程开发以及多进程应用场景；9...

原创 2018-11-30 11:53:21 · 347 阅读 · 0 评论
MapReduce经典案例 ------- 学生成绩处理

目录算每个人的平均成绩求每个学科的平均成绩总平均分每个分数段的人数以及百分比将三门课程中任意一门不及格的学生过滤出来统计成材率每一门成绩都大于60分的人数/总人数待处理数据内容：学生成绩表名字语文数学英语 lh 92 68 70 zyt 94 88 75 ls 96 78 ...

原创 2018-11-09 08:52:23 · 3827 阅读 · 1 评论
MapReduce经典案例 -------- 统计最高温度

需求：求给定日期的最高温度待处理数据内容： 201701082.6 201701066 2017020810 2017030816.33 2017060833.0每一行的前8位是日期，从第8位往后是温度代码import java.io.IOException;import org.apache.hadoop.conf.Configuration;...

原创 2018-11-09 08:51:55 · 2746 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 -------- 内存排序

TOP N数据：hello qianfeng hello qianfeng qianfeng is best qianfeng better hadoop is goodspark is nice取统计后的前三名： qianfeng 4 is 3 hello 2import java.io.IOException;import java.util.Array...

原创 2018-11-10 08:49:58 · 311 阅读 · 0 评论
优快云如何转载博客

对于喜欢逛优快云的人来说，看别人的博客确实能够对自己有不小的提高，有时候看到特别好的博客想转载下载，但是不能一个字一个字的敲了，这时候我们就想快速转载别人的博客，把别人的博客移到自己的空间里面，当然有人会说我们可以收藏博客啊，就不需要转载，(⊙o⊙)… 也对。。实现因为我自己当初想转载的时候却不...

转载 2018-11-07 11:47:30 · 127 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ----------- 自定义MapReduce数据类型（1）重写Writable接口

重写Writable接口如下代码就是自定义mr数据类型，在wordcount类使用它。WordCountWritableimport java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import org.apache.hadoop.io.Writable;/** * 自定义wc...

原创 2018-11-10 08:57:54 · 941 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 -------- 使用自定义数据实现内存排序

自定义数据WCDataimport java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import org.apache.hadoop.io.WritableComparable;/** * 自定义数据类型 * @author lyd * */public class WCData...

原创 2018-11-10 09:01:10 · 293 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ------- 使用自定义MapReduce数据类型实现二次排序

自定义数据类型SSData import java.io.DataInput;import java.io.DataOutput;import java.io.IOException;import org.apache.hadoop.io.WritableComparable;public class SSData implements WritableComparable<...

原创 2018-11-10 09:39:47 · 331 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ---------- 内存排序找出每一组中的最大值

待处理数据内容如下二次排序：23 32123 29023 56778 65078 55478 75616 1816 1616 159 89 09 3处理后的数据内容如下输出数据：-----------9 8-----------16 18----------23 567-----------78 756MapReduce类Find...

原创 2018-11-10 09:42:45 · 721 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ------- 排序找出每一组中的最大值（中间结果不在内存中）

功能：同内存排序求最大值，只是中间结果不在内存中，避免了数量过大造成内存溢出的问题。知识点分组比较器的使用 job.setGroupingComparatorClass(GroupingComparator.class);自定义mr类SSDataimport java.io.DataInput;import java.io.DataOutput;import java.i...

原创 2018-11-10 09:45:44 · 655 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 ------- 两个表的简单join操作

待处理数据内容如下表1： child parent 张三王阿姨张三张大叔张张王阿姨张张张大叔王阿姨王奶奶王阿姨王大爷张大叔张奶奶张大叔张大爷处理后的数据内容如下输出数据：grandchild grandparent *张三张大爷 *张三张奶奶 *张三王奶奶 *张三王大爷 *张张张大爷 *张张张奶奶 ...

原创 2018-11-10 09:48:05 · 1248 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 --------- 多表连接

第一张表的内容：login：uid sexid logindate1 1 2017-04-17 08:16:202 2 2017-04-15 06:18:203 1 2017-04-16 05:16:244 2 2017-04-14 03:18:205 1 2017-04-13 02:16:256 2 2017-04-13 01:15:207 1 20...

原创 2018-11-10 10:10:33 · 879 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 --------- MapReduce各组件之间数据传递

简单说就是在map中设置一个值，在reduce中能够获得这个值 import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;import org.apache...

原创 2018-11-11 17:32:56 · 600 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 --------- 多个job之间有序执行

每一个MapReduce程序都封装成一个job，而多个job之间呢？后一个job输入的数据，就是前一个job的输出的数据。本节就是演示这种场景：顺序执行两个job执行是有先后顺序的 import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoo...

原创 2018-11-11 17:33:21 · 701 阅读 · 0 评论
结合案例讲解MapReduce重要知识点 --------- 自定义OutputFormat

需求现有一些原始日志需要做增强解析处理，流程：（1）从原始日志文件中读取数据（2）根据日志中的一个URL字段到外部知识库中获取信息增强到原始日志（3）如果成功增强，则输出到增强结果目录；如果增强失败，则抽取原始数据中URL字段输出到待爬清单目录。实现的需求是：默认reduce执行后，输出数据的目的文件是固定的一个文件，那怎样实现根据数据的不同...

原创 2018-11-11 17:33:30 · 283 阅读 · 0 评论
HDFS的java api详解 ------ 代码演示

目录 HDFS控制（Java）代码演示HDFS控制（Java）hadoop中关于文件操作类基本上全部是在org.apache.hadoop.fs包中，这些api能够支持的操作包含：打开文件，读写文件，删除文件等。FileSystem，该类是个抽象类，只能通过来类的get方法得到具体类。get方法存在几个重载版本，常用的是这个：static FileSystem get(...

原创 2018-11-08 09:31:51 · 307 阅读 · 0 评论
Zookeeper java API的使用

1 eclipse环境配置普通的java项目创建一个java项目依赖的jar包zookeeper-3.4.7\lib下的 jline-0.9.94.jar log4j-1.2.15.jar netty-3.2.2.Final.jar slf4j-api-1.6.1.jar slf4j-log4j12-1.6.1.jarzookeeper-3.4.7\zookeeper-3....

原创 2018-11-06 19:56:20 · 259 阅读 · 0 评论