自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(76)
  • 收藏
  • 关注

原创 dolphinscheduler独立集群部署文档(海豚调度)

海豚调度独立集群部署文档

2024-06-14 20:17:00 587

原创 Flink Sql:四种Join方式详解(基于flink1.15官方文档)

Regular Joins(常规连接 ),Interval Joins(间隔连接),Temporal Joins(时态连接),lookup join(查找连接)

2024-06-07 08:00:00 5462

原创 Flink SQL查询语法部分详解(提供需求、数据练习复现)

Hints、WITH、DISTINCT、窗口函数(TVFs)、OVER聚合、ORDER BY、模式检测(CEP)

2024-06-05 08:30:00 1415 3

原创 Flink系列六:Flink SQl 之常用的连接器(Connector)

动态表 & 连续查询,连接器(Connector),数据格式

2024-06-04 08:30:00 2598

原创 Flink系列四:Flink中并行度、算子链、任务槽详解

Flink中并行度、算子链、任务槽、solt任务与并行度的关系。

2024-06-03 08:00:00 2476

原创 Kafka篇:Kafka搭建、使用、及Flink整合Kafka文档

Kafka搭建、使用、及Flink整合Kafka

2024-06-01 08:30:00 2030

原创 Kafka Java API

Kafka Java API

2024-06-01 08:00:00 256

原创 Flink系列三:Flink架构、独立集群搭建及Flink on YARN模式详解

Flink架构,Flink独立集群搭建与使用,Flink on yarn的三种部署模式(Application,Per-Job Cluster,Session )

2024-05-31 08:30:00 3351

原创 Flink系列二:DataStream API中的Source,Transformation,Sink详解(^_^)

举例:使用自定义source读取mysql中的数据/*实现方式:* 1、实现SourceFunction或ParallelSourceFunction接口来创建自定义的数据源。* 2、然后使用env.addSource(new CustomSourceFunction())或DataStreamSource.fromSource添加你自定义的数据源。*///使用自定义的source//统计学生表每个班级的人数//取出每一行的班级列并加上人数后缀1。

2024-05-29 23:12:38 1305 1

原创 Flink系列一:flink光速入门 (^_^)

引入(spark和flink的区别),离线和实时的区别,主流实时计算框架对比,Spark Streaming微批处理 与Flink流式处理对比,Apache Flink简介(概述、特性、组件栈),入门案例

2024-05-28 20:24:16 903

原创 Spark Sql写代码方式(yarn)以及 spark sql整合hive详解

IDEA里面将代码编写好打包上传并提交打到yarn上运行,Spark Shell(repl),Spark SQL 命令行界面(CLI),spark sql整合hive,在IDEA使用代码操作spark整合的hive,在linux命令行写spark-sql

2024-05-28 08:30:00 1459

原创 Spark SQL 中DataFrame DSL的使用

单词统计案例引入,数据源获取,DataFrame DSL API的使用,RDD与DataFrame的转换

2024-05-24 19:50:58 1236

原创 SparkSQL入门

SparkSQL是什么、SparkSQL 的适用场景、结构化、非结构化、半结构化数据的区别、程序入口SparkSession、DataFrame和Dataset、入门程序案例(直接执行 SQL)

2024-05-23 01:02:00 973

原创 Spark中的累加器与广播变量及blockmanager图解

Spark中的累加器图解、广播变量图解、blockmanager图解

2024-05-22 16:28:20 404

原创 Spark在YARN上运行图解(资源调度+任务调度)及案例

Spark集群配置YARN、client与cluster提交流程图解、编写spark程序在yarn上执行(计算圆周率)

2024-05-22 00:24:23 1527

原创 Spark搭建 Standalone模式详细步骤

Spark搭建 Standalone模式详细步骤

2024-05-21 21:41:07 2641

原创 Spark中RDD概述及RDD算子详解

Spark中RDD概述及RDD算子详解

2024-05-21 19:59:36 1302

原创 Spark的概述、核心、组成、运行模式

Spark的概述、核心、组成

2024-05-21 12:07:47 543

原创 Scala编程基础7:模式匹配、隐式转换详解

模式匹配:匹配基本数据类型、字符串、元组、数组、值的类型、模式匹配的应用,隐式转换:隐式转换函数、类、变量

2024-05-15 14:20:38 254

原创 Scala编程基础6:连接mysql数据库、在scala中使用fastJson

连接mysql数据库、在scala中使用fastJson

2024-05-15 14:07:02 278

原创 Scala编程基础5:元组、集合、高阶函数详解

元组,集合(List、Set、Map、不可变集合、scala集合与java互相转换),高阶函数详解(foreach、map、flatten、flatmap、 filter、sortBy 、groupBy 等 ),入门案例练习(单词统计)

2024-05-15 11:38:48 678

原创 Scala编程基础4:面向函数编程思想之函数作为参数进行传递与函数作为返回值返回、柯里化详解

函数作为参数进行传递、函数作为函数的参数传递的应用、函数作为返回值返回、柯里化、偏函数

2024-05-15 10:48:50 310

原创 Scala编程基础3:函数式编程思想之类与对象、重写、样例类

类与对象、重写、伴生对象、样例类

2024-05-15 10:36:00 206 1

原创 Scala编程基础2:函数、递归、异常

函数的定义与调用、递归、异常

2024-05-15 10:25:45 230

原创 Scala编程基础1:基本数据类型、变量、if、for、IO

基本数据类型、变量、if、for、IO

2024-05-15 10:00:35 432

原创 hive日常使用时忘记部分补充(不定时)

hive日常使用时忘记部分补充

2024-05-07 20:32:05 357 2

原创 十个案例学习Flume

基本采集,多路复制,负载均衡,聚合,自定义拦截器

2024-04-27 08:30:00 1433

原创 Flume概述、架构、运行机制

Flume概述、架构(source,channel,sink)、运行机制

2024-04-27 08:00:00 1186

原创 HBase中rowkey的设计与热点问题的处理方案

HBase中rowkey的设计与热点问题的处理方案

2024-04-25 08:30:00 774

原创 Hbase中二级索引与Phoenix二级索引实现

Hbase中二级索引与Phoenix二级索引实现

2024-04-25 08:30:00 1064

原创 HBase的读写流程与Region的分裂策略

HBase的读写流程与Region的分裂策略

2024-04-24 20:38:37 864

原创 布隆过滤器概述及其实现原理

布隆过滤器概述、运用场景、实现原理、误判现象

2024-04-24 20:10:25 1305

原创 Hbase java API与过滤器

Hbase java API与过滤器

2024-04-24 19:44:52 923 2

原创 预分region解决热点问题(面试题)

预分region解决热点问题

2024-04-17 20:31:16 515

原创 Hbase的shell命令(详细)

Hbase的shell命令,包括命名空间操作(namespace),表操作(DDL),数据操作(DML),计数器,修饰词过滤,FILTER条件过滤器,与region有关的命令

2024-04-17 16:29:09 5092 2

原创 HBase的数据模型与架构

HBase的数据模型与架构(图解)

2024-04-16 19:56:19 1391

原创 hbase-2.2.7分布式搭建

hbase-2.2.7分布式搭建

2024-04-15 20:16:42 1085 1

原创 Hive优化

hive的九种优化方式

2024-04-15 08:30:00 875

原创 hive的自定义函数

自定义函数的创建

2024-04-13 08:00:00 1159

原创 Hive函数

条件函数,日期函数,字符串函数,窗口函数(聚合开窗函数和排序开窗函数)

2024-04-12 20:09:57 1353

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除