Shawlizao-优快云博客

目录1 常见的数据结构1.1 数组(Array)基本概念特性1.2 栈(stack)1.3 队列(Queue)1.4 链表(Linked List)1.5 图1.6 树二叉树(Binary Tree)红黑树(Binary Tree)1.7 散列表（哈希表）2 那你说一下数组和链表的区别吧？数组链表了解数据结构吗？说一下常见的数据结构？xysj面试1 常见的数据结构1.1 数组(Array)基本概念数组是一种线性表数据的结构，他用一组连续的内存空间，来存储一组相同数据类型的数据。每一个数组元素的位置

2021-03-14 02:14:12 564

原创面试_大数据

两个很大和很小数据量做差集，如何去用mapreduce优化数据库的四大事物特性原子性等是如何保证的（数据库底层的优化）mapreduce流程方面mapreduce数据倾斜处理方面需要增加实战经验SQL的优化方法，最好联合实际。...

2021-02-25 17:44:58 254

原创面试_算法

目录Java 实例 - 斐波那契数列Java 实例 - 斐波那契数列斐波那契数列指的是这样一个数列 0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233，377，610，987，1597，2584，4181，6765，10946，17711，28657，46368……特别指出：第0项是0，第1项是第一个1。这个数列从第三项开始，每一项都等于前两项之和。。//java实现输入n 得到第n个斐波那契数结果/** * @Date 2021/3/23

2021-03-23 01:05:08 275

原创面试_Java其他相关_spring_mysql_redis

目录1 SpringSpring是什么？AOP的理解IOC的理解，如何实现一个IOC容器BeanFactory和ApplicationContext有什么区别？Spring如何使用三级缓存解决循环依赖的问题Spring Bean的生命周期Spring bean的作用域Spring 事务方式Spring 事务在哪些场景下会失效Spring 单例bean是线程安全的吗？Spring中有过哪些设计模式AOP代理模式Spring Boot听过吗？它是什么？SpringMVC？2 mysqlmybatis优缺点#{}

2021-03-18 01:32:03 886

原创面试_Java基础

目录1 Java基础类加载过程并发容器问题，Java内存模型是怎样的，新生代和老年代的垃圾回收算法分别有哪些？区别是什么，有没有遇到过频繁fullGC的问题，如何排查解决switch 语句能否作用在 byte 上，能否作用在 long 上，能否作用在 String 上?final 关键字重载和重写的区别"=="和 equals 方法究竟有什么区别？1.9 静态变量和实例变量的区别？1.10 是否可以从一个 static 方法内部发出对非 static 方法的调用1.11 Integer 与 int 的区

2021-03-15 01:17:56 1320

原创大数据学习_消息中间件_Kafka架构与实战

目录1 概念和基本架构1.1 Kafka介绍1.2 Kafka优势1.3 Kafka应用场景1.4 kafka基本架构1.5 核心概念2 Kafka安装与配置2.1 Kafka启动与基本命令3 Kafka开发实战3.1 消息的发送与接收3.2 SpringBoot 整合 Kafka1 概念和基本架构1.1 Kafka介绍Kafka是最初由Linkedin公司开发，是一个分布式、分区的、多副本的、多生产者、多订阅者，基于zookeeper协调的分布式日志系统（也可以当做MQ系统），常见可以用于web

2021-03-09 17:46:58 573

原创大数据学习_Redis5.0集群的搭建与添加

## 1.环境准备yum install -y gcc-c++ yum install -y wget## 2.下载并解压rediswget http://download.redis.io/releases/redis-5.0.5.tar.gztar -zxf redis-5.0.5.tar.gz## 3.编译Redis源码cd redis-5.0.5/srcmake## 4.创建集群目录，开始安装mkdir -p /var/redis-cluster/7001make ins

2021-03-06 00:35:27 309 1

原创大数据学习_Redis_缓存原理&设计

目录1 缓存基本思想2 Redis基础2.1 Redis介绍2.1 Redis单机版安装和使用2.3 Redis数据类型和应用场景3 Redis持久化3.1 为什么要持久化1 缓存基本思想什么是缓存？缓存原指CPU上的一种高速存储器，它先于内存与CPU交换数据，速度很快现在泛指存储在计算机上的原始数据的复制集，便于快速访问。以空间换时间的一种技术。缓存的使用场景DB缓存，减轻DB服务器压力一般情况下数据存在数据库中，应用程序直接操作数据库。当访问量上万，数据库压力增大，可以采取的方案有

2021-03-05 17:13:10 975 1

原创大数据学习_azkaban启动及报错解决

节点安排host服务centos7-1exec-servercentos7-2web-servercentos7-3mysql,exec-server启动## 启动顺序：hdfs yarn zookeeper 1/3节点上的azkaban-exec 最后是3节点上azkaban-web# centos7-1 start-dfs.shsh /root/shell/zk.sh startstart-hbase.shcd /opt/lagou/server

2021-03-04 11:25:31 752 1

原创大数据学习_HBase

目录1 HBase 简介1.1 HBase是什么1.2 HBase的特点1.3 HBase的应⽤2 HBase数据模型3 HBase整体架构4 HBase集群安装部署5 HBase shell 基本操作6 HBase原理深⼊6.1 HBase读数据流程6.2 HBase写数据流程6.3 HBase的flush(刷写)及compact(合并)机制6.4 Region 拆分机制6.5 HBase表的预分区(region)6.6 Region 合并7 HBaseAPI应用和优化7.1 API应用7.2 Hb

2021-03-01 18:39:45 395

原创大数据学习_分布式协调服务_Zookeeper

目录1. Zookeeper简介1.1 Zookeeper是什么？1.2 zookeeper的架构组成1.3 Zookeeper 特点2 Zookeeper环境搭建2.1 Zookeeper的搭建方式1. Zookeeper简介1.1 Zookeeper是什么？Zookeeper 是一个分布式协调服务的开源框架。主要用来解决分布式集群中应用系统的一致性问题，例如怎样避免同时操作同一数据造成脏读的问题。分布式系统中数据存在一致性的问题！！ZooKeeper 本质上是一个分布式的小文件存储系统。提

2021-03-01 10:55:39 427 1

原创大数据学习_问题解决_Idea多次启动同一个main 方法

在使用zk自身api进行动态监听的学习中，需要启动两次server中的main方法提供两个服务器。没有勾选下图中allow parallel run会导致第二次启动时停止第一次启动，把他打开即可多次启动同一个main方法。完美启动。...

2021-02-28 19:31:00 326

原创大数据学习_问题解决_设定hdfs短路读取后datanode不启动问题

出现问题：在进行impala配置时，由于设置了短路读取，导致启动dfs时无法启动datanode，集群也一直处于安全模式中。# 2.修改hdfs-site.xml   <property> <name>dfs.client.read.shortcircuit</name> <value>true</value

2021-02-25 00:30:41 781 4

原创大数据学习_交互式查询工具 Impala

目录1 Impala概述(实时交互式查询工具)1.1 Impala是什什么1.2 Impala优势主要内容第 1 部分 Impala概述（Impala是什什么，优势，劣势，与Hive对⽐比）第 2 部分 Impala的安装(制作本地Yum源⽅方式安装)第 3 部分 Impala的架构原理理(有哪些组件，组件的作⽤用，查询流程，查询计划)第 4 部分 Impala的使⽤用（使⽤用与Hive类似，编写sql⽅方式； Impala的DDL,查询语法，导⼊入数据）第 5 部分 Impala的Java 开

2021-02-25 00:20:55 1446 3

原创大数据学习_数据迁移工具 Sqoop

目录1 Sqoop概述2 安装配置3 应用案例3.1 导入数据3.2 导出数据3.3 增量数据导入1 Sqoop概述Sqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql等)间进行数据的传递。可以将关系型数据库（MySQL ,Oracle ,Postgres等）中的数据导入到HDFS中，也可以将HDFS的数据导进到关系型数据库中。Sqoop项目开始于2009年，最早是作为Hadoop的一个第三方模块存在，后来为了让使用者能够快速部署，也为了让开发

2021-02-24 14:43:02 820

原创大数据学习_数据采集工具 Flume

目录1 Flume概述1.1 Flume的定义1.2 Flume体系结构1.3 Flume拓扑结构21 Flume概述1.1 Flume的定义Flume由Cloudera公司开发，是一个分布式、高可靠、高可用的海量日志采集、聚合、传输的系统。Flume支持在日志系统中定制各类数据发送方，用于采集数据；Flume提供对数据进行简单处理，并写到各种数据接收方的能力。简单的说，Flume是实时采集日志的数据采集引擎。Flume有3个重要组件：Source、Channel、Sink特点：分布

2021-02-22 18:21:04 1140 1

原创大数据学习_Hive_调优策略/_Hue的安装和使用

目录1 Hive调优策略1.1 架构优化1.2 参数优化1.3 SQL优化1 Hive调优策略Hive作为大数据领域常用的数据仓库组件，在设计和开发阶段需要注意效率。影响Hive效率的不仅仅是数据量过大；数据倾斜、数据冗余、job或I/O过多、MapReduce分配不合理等因素都对Hive的效率有影响。对Hive的调优既包含对HiveQL语句本身的优化，也包含Hive配置项和MR方面的调整。从以下三个方面展开：架构优化参数优化SQL优化1.1 架构优化执行引擎Hive支持多种执行引

2021-02-19 01:26:19 1254

原创大数据学习_Hive_DML

目录1 HQL操作之--DML命令1.1 Hive 事务1.2 Hive 事务操作示例2 元数据管理与存储2.1 Metastore2.2 HiveServer21 HQL操作之–DML命令数据操纵语言DML(Data Manipulation Language)，DML主要有三种形式：插入(INSERT)、删除(DELETE)、更新(UPDATE)。事务(transaction)是一组单元化操作，这些操作要么都执行，要么都不执行，是一个不可分割的工作单元。事务具有的四个要素：原子性（Atomic

2021-02-10 00:18:10 620

原创大数据学习_Hive_DQL操作及函数

目录1 HQL操作之 -- DQL命令1.1 基本查询1.2 where子句1.3 group by子句1.4 表连接1.5 排序子句【重点】2 函数【重难点】2.1 系统内置函数1 HQL操作之 – DQL命令DQL – Data Query Language 数据查询语言select语法：SELECT [ALL | DISTINCT] select_expr, select_expr, ...FROM table_reference[WHERE where_condition][GROU

2021-02-04 11:40:39 653

原创大数据学习_Hive_背景与基本操作

目录1 Hive概述1.1 Hive产生背景1.2 Hive和RDBMS(关系数据库管理系统)对比1.3 Hive的优缺点1.4 Hive架构1 Hive概述1.1 Hive产生背景直接使用MapReduce处理大数据，将面临以下问题：MapReduce 开发难度大，学习成本高(wordCount => Hello World)Hdfs文件没有字段名、没有数据类型，不方便进行数据的有效管理使用MapReduce框架开发，项目周期长，成本高Hive是基于Hadoop的一个数据仓库工

2021-02-01 23:47:17 436

原创大数据学习_Hadoop_调优及二次开发示例

目录1 Job执行三原则1.1 原则一充分利用集群资源1.2 原则二 ReduceTask并发调整1.3 原则三 Task执行时间要合理2 Shuffle调优2.1 Map阶段2.2 Copy阶段2.3 Reduce阶段3 Job调优1 Job执行三原则充分利用集群资源reduce阶段尽量放在一轮每个task的执行时间要合理1.1 原则一充分利用集群资源Job运行时，尽量让所有的节点都有任务处理，这样能尽量保证集群资源被充分利用，任务的并发度达到最大。可以通过调整处理的数据量大小，以

2021-02-01 21:55:07 1445

原创大数据学习_Hadoop_Hadoop 3.x 新特性概述

目录1 Hadoop3.x新特性之Common改进2 Hadoop3.x新特性之YARN改进3 Hadoop3.x新特性之MapReduce改进Hadoop3.x中增强了很多特性，在Hadoop3.x中，不再允许使用jdk1.7，要求jdk1.8以上版本。这是因为Hadoop2.0是基于JDK 1.7开发的，而JDK 1.7在2015年4月已停止更新，这直接迫使Hadoop社区基于JDK 1.8重新发布一个新的Hadoop版本，而这正Hadoop3.x。Hadoop3.x以后将会调整方案架构，将Map

2021-02-01 15:43:11 504

原创大数据学习_Hadoop_YARN资源调度

目录1 Yarn架构2 Yarn任务提交(工作机制)3 Yarn调度策略4 Yarn多租户资源隔离配置1 Yarn架构**ResourceManager(rm)：**处理客户端请求、启动/监控ApplicationMaster、监控NodeManager、资源分配与调度；**NodeManager(nm)：**单个节点上的资源管理、处理来自ResourceManager的命令、处理来自ApplicationMaster的命令；**ApplicationMaster(am)：**数据切分、为应用程序

2021-01-31 19:11:13 273

原创大数据学习_Hadoop_MR算法扩展

1 MergeSort 归并排序合并的过程：合并细节(开辟一半的空间即可)：不断地将当前序列平均分割成 2个子序列直到不能再分割（序列中只剩 1个元素）不断地将 2个子序列合并成一个有序序列直到最终只剩下 1个子序列...

2021-01-31 18:12:27 201

原创大数据学习_Hadoop_MapReduce编程框架

目录1 MapReduce思想2 官方WordCount案例源码解析2.1 Hadoop序列化3 MapReduce编程规范及示例编写3.1 Mapper类3.2 Reducer类3.3 Driver阶段1 MapReduce思想MapReduce的思想核心是分而治之，充分利用了并行处理的优势。MapReduce任务过程是分为两个处理阶段：Map阶段：Map阶段的主要作用是“分”，即把复杂的任务分解为若干个“简单的任务”来并行处理。Map阶段的这些任务可以并行计算，彼此间没有依赖关系。(计算代码相

2021-01-27 21:09:19 1055 2

原创大数据学习_Hadoop_HDFS分布式文件系统

目录1 HDFS简介2 HDFS的重要概念3 HDFS 架构4 HDFS 客户端操作4.1 Shell 命令行操作HDFS4.2 Win环境下JAVA客户端5 HDFS读写解析5.1 HDFS读数据流程5.2 HDFS写数据流程6 NN与2NN6.1 HDFS元数据管理机制6.2 Fsimage与Edits文件解析6.2.1 Fsimage文件内容6.2.2 Edits文件内容6.3 checkpoint周期7 NN故障处理8 Hadoop的限额与归档以及集群安全模式8.1 HDFS文件限额配置8.2 H

2021-01-25 15:29:15 477

原创大数据学习_HDFS_Shell命令大全

[root@linux121 hadoop-2.9.2]# bin/hdfs dfsUsage: hadoop fs [generic options][-appendToFile … ][-cat [-ignoreCrc] …][-checksum …][-chgrp [-R] GROUP PATH…][-chmod [-R] <MODE[,MODE]… | OCTALMODE> PATH…][-chown [-R] [OWNER][:[GROUP]] PATH…][-c

2021-01-25 11:23:33 192 2

原创大数据学习_Hadoop

1 Hadoop简介1.1 Hadoop是什么?Hadoop是一个由Apache基金会所开发的分布式系统基础架构，是一个适合大数据的分布式存储和计算平台。主要解决：海量数据的存储和海量数据的分析计算问题。狭义上说Hadoop就是一个框架平台，广义上讲Hadoop代表大数据的一个技术生态圈，包括很多其他软件框架。1.2 Hadoop发行版本Apache Hadoop 原始版本(最原始的版本，适合入门学习)官网地址：http://hadoop.apache.org/优点：拥有全世界的开源贡献

2021-01-25 10:50:50 224

原创大数据学习_Spring传接Json对象字符串

习_Spring传接Json对象字符串1. 前言1.1 需求1.2 实现2. Ajax发送请求中的Json格式2.1 jQuery封装后的ajax2.2 @RequestBody与@ResponseBody1. 前言1.1 需求又一次写ajax请求，后台总是接收null，问题原因是Json格式没缕清，此篇文章好好整理下。此块的需求如下：实现网页端基于ajax请求发送页面input标签中的一个字符给后端控制层，控制层拿到数据调用方法后返回一个对象给前端，前端接收到对象后执行业务响应。

2021-01-11 22:35:52 372 1

原创大数据学习_JdbcTemplate与Mybatis对比

大数据学习_JdbcTemplate与Mybatis对比1.JDBC1.1JDBC概念1.2JDBC原理1.3原始JDBC操作1.4步骤总结1.5原生JDBC缺点2.JdbcTemplate2.1JdbcTemplate概念2.2JdbcTemplate操作数据库优点缺点3.Mybatis3.1Mybatis概念3.2Mybatis原理3.3Mybatis操作数据库3.4Mybatis基于接口代理方式的内部执行原理1.JDBC1.1JDBC概念JDBC(Java Data Base Connectiv

2021-01-07 15:45:22 2726 1

原创通过fetch读取本地数据报错

通过fetch读取本地数据报错未安装LiveServer前，通过fetch读取本地文件报错：Fetch APT cannot load XXXX URL scheme must be "http" or "https" for CORS request.然后开始找解决方法，尝试使用tomcat将json文件上传到服务器上，然后再去读取，还是报错。原因是浏览器安全限制不允许跨域访问，然后修改web.xml文件，问题解决。最后看到一个Live Server的插件，右键使用Live Server打开可

2020-12-15 22:41:24 2340 1

原创上班摸鱼第一记——Ubuntu新硬盘挂载

Ubuntu18.04系统新硬盘挂载公司赔配了一台戴尔工作站，搭配了8T的企业硬盘，在Ubuntu系统下却并没有显示，检查了一下发现是没有被挂载。又学到了一点，记下来以备后用。OS：Ubuntu18.04HDD：希捷 8T首先开主机侧盖检查了硬盘SATA线连接情况，确保连接到主板接口上。接着查看当前硬盘、分区状况sudo fdisk -l没有文件系统的便是还没有利用的硬盘3. 对未利用的硬盘进行格式化sudo mkfs.ext4 /dev/sda将其挂载在根(/)目录下包括

2020-08-04 20:50:28 370

qq_41612830的博客

原创排序算法的一些总结

原创面试_数据结构基础