自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 大数据学习笔记整理之MapReduce工作原理

MapReduce主要分为三个阶段,Map阶段,Shuffle阶段,Reduce阶段。 Map阶段: 将输入的多个分片(Split)有Map任务以完全并行方式进行处理。一个分片对应一个map任务,在默认的情况下,分片的大小与HDFS中数据块(Block)大小一致,可以通过调整HDFS中block的大小来控制map的任务数量。 每个Map任务对输入分片中的数据按照一定的规则解析成多个KV键值对,默认是把每一行文本内容解析成一个KV键值对,key为每一行的其实位置,即每一行的偏移量,value为本行的文本内容

2020-09-28 11:52:39 321

原创 HBase架构

了解HBase HBase是一个高可靠性,高性能,面向列,可伸缩的分布式存储系统。 HBase架构 HBase采用Master/Slave架构搭建集群,由HMaster,HRegionServer,Zookeeper组成,讲数据存储在HDFS中。HMaster主要负责利用Zookeeper为HRegionServer分配HRegion。Zookeeper是一个高可靠,高可用,持久化的分布式协调系统。Client使用HBase的远程过程调用协议(Remote Procedure Call Protocol,

2020-09-21 23:08:37 168

原创 kafka 架构以及保证数据不丢失

kafka架构 kafka基本组成 kafka集群中生产者将消息发送给Topic命名的消息队列Queue中,消费者订阅发送以某个Topic命名的消息队列Queue中的消息。 Broker: 一台kafka服务器就是一个broker,一个集群中由多个broker组成,一个Broker可以容纳多个Topic,Broker和Broker之间是平级的。 Topic:每条发送到Kafka集群的消息都属于某个主题,这个主题就称为Topic。 Partition:一个Topic可以被分为多个Partition

2020-09-14 10:30:10 171

原创 hadoop yarn里面的基本架构

yarn的基本架构 yarn的基本思想是讲JobTracker的资源管理和作业调/监控两大主要职能拆分为两个独立的进程:一个是全局的Resource Manager(RM),以及一个每个应用对应的Application Master(AM), Resource Manager(RM)和每个节点上的Node Manager(NM)组成了一个全新的通用操作系统,以及一个分布式的方法管理应用程序 Resource Manager拥有系统所有应用分配资源的决定权, 其中RM有一个可插拔的调度组件Scheduler

2020-09-02 22:58:35 466

原创 Mysql 存储过程

存储过程概念 存储过程(Stored Procedure)是在大型数据库系统中,一组为了完成特定功能的SQL 语句集,它存储在数据库中,一次编译后永久有效,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。存储过程是数据库中的一个重要对象。在数据量特别庞大的情况下利用存储过程能达到倍速的效率提升 存储过程结构 CREATE [DEFINER = user] PROCEDURE sp_name ([proc_parameter[,...]]) [character

2020-08-24 10:48:43 125

原创 flume sources type支持类型

Avro Source 参数配置 Thrift Source Http Source Spooling Directory Source

2020-07-20 13:28:32 271

原创 Kafka 主题以及生产者一些操作

主题管理 创建主题 kafka-topics.sh --create --zookeeper bigdata1:2181 --replication-factor 2 --partitions 3 -- topic supernova 以上就是创建了一个supernova主题 改主题有两个副本 三个分区 删除主题 kafka-topics.sh --delete --zookeeper bigdata1:2181 --topic supernova 当delete.topic.enable 设置为fals

2020-06-23 21:16:30 485

原创 mybatis入门及案例

背景介绍 MyBatis 是支持普通 SQL查询,存储过程和高级映射的优秀持久层框架。MyBatis 消除了几乎所有的JDBC代码和参数的手工设置以及结果集的检索。MyBatis 使用简单的 XML或注解用于配置和原始映射,将接口和 Java 的POJOs(Plain Ordinary Java Objects,普通的 Java对象)映射成数据库中的记录。 每个MyBatis应用程序主要都是使用SqlSessionFactory实例的,一个SqlSessionFactory实例可以通过SqlSessionF

2020-06-04 14:25:33 791

原创 回文数 leetcode 初级算法

回文数 leetcode 初级算法 题目要求 :判断一个整数是否是回文数。回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数。 例如1: 输入 :123 返回 :false 例如2 输入 323 返回 true 案例分析 :分析题目回文数是指正序和倒序都是一样的整数 所以我们可以先把原来的数倒序 在进行判断两个数是都是一样的 废话少说 直接上代码 class Solution { public boolean isPalindrome(int x) { //定义

2020-05-25 22:43:52 153

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除