自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

向热爱自己一样,热爱这个世界。

向热爱自己一样,热爱这个世界。

  • 博客(95)
  • 收藏
  • 关注

原创 Anaconda3 常用命令及配置

系统环境:windows10Anaconda版本:Anaconda3-2024.02-1-Windows-x86_643、复制虚拟环境5、进入虚拟环境2.2、包管理1、查看安装包2、安装python包3、更新安装包4、卸载安装包2.3、镜像源管理1、查看已配置的镜像源conda config --add channels url3、删除镜像源conda config --remove channe

2024-06-24 09:53:18 946

原创 Anaconda3 下载&安装&卸载

手把手教你如何下载&安装Anaconda

2024-06-09 10:30:24 486 1

原创 3、如何从0到1去建设数据仓库

如何从0到1去建设数据仓库

2023-11-23 14:32:29 2212

原创 2、数仓理论概述与相关概念

数仓理论概述与相关概念

2023-11-22 16:42:30 895

原创 1、数仓模型概述

数仓模型概述

2023-11-21 16:17:11 294

原创 《数据仓库入门实践》

1、问什么要写这篇博客?随着自己在`数仓`岗位工作的年限增加,对数仓的理解和认知也在发生着变化所有用这篇博客来记录工作中用到的`知识点`与`经验`2、这篇博客主要记录了那些内容?主要会记录一些`数仓建设方法论`和工作技巧。

2023-11-20 18:28:48 651

原创 【hive 面试题】聚合操作时null和‘‘对结果的影响

【hive 面试题】聚合操作时null和''对结果的影响

2023-11-01 19:31:13 439

原创 2.4 如何在FlinkSQL使用DataGen(数据生成器)

在FlinkSQL使用DataGen(数据生成器)创建source表

2023-10-18 22:36:26 2137

原创 2.3 如何使用FlinkSQL读取&写入到JDBC(MySQL)

使用FlinkSQL读取&写入到JDBC(MySQL)

2023-10-18 18:48:23 5281

原创 2.2 如何使用FlinkSQL读取&写入到文件系统(HDFS\Local\Hive)

如何使用FlinkSQL读取&写入到文件系统(HDFS\Local)

2023-10-17 18:35:25 5649 1

原创 2.1、如何在FlinkSQL中读取&写入到Kafka

使用 flinksql读取、写入kafka

2023-10-11 17:14:01 11379

原创 1、手把手教你学会使用 FlinkSQL客户端

手把手教你学会使用 FlinkSQL客户端

2023-10-02 11:12:21 1986

原创 7、如何使用Flink中的窗口(Window算子)

如何在Flink中使用窗口

2023-09-26 16:04:43 1379

原创 7.2、如何理解Flink中的水位线(Watermark)

如何理解Flink中的水位线(Watermark)

2023-09-22 16:04:33 1009

原创 7.1、如何理解Flink中的时间语义

如何理解Flink中的时间语义

2023-09-19 16:56:52 701

原创 hive、spark、presto 中的增强聚合-grouping sets、rollup、cube

如何在 hive、spark、presto 中使用增强聚合-grouping sets、rollup、cube

2023-09-19 12:40:50 1771

原创 6、如何将 Flink 中的数据写入到外部系统(文件、MySQL、Kafka)

如何将 Flink 中的数据写入到外部系统(文件、MySQL、Kafka)

2023-09-14 15:48:31 417

原创 6.3、Flink数据写入到MySQL

Flink数据写入到MySQL

2023-09-14 15:34:09 1612

原创 6.2、Flink数据写入到Kafka

Flink数据写入到Kafka

2023-09-13 17:08:20 2861 1

原创 6.1、Flink数据写入到文件

Flink数据写入到文件(HDFS)

2023-09-12 18:22:51 1370

原创 5、flink任务中常用的转换算子(Transformation)

使用用户定义的 Partitioner 将元素分发到下游算子的分区中去// 1.获取执行环境/** 功能说明:* 自定义分区器,根据输入的数据获取分区编号* 泛型说明:* @K : key的数据类型* */@Overridereturn 0;return 1;/** 功能说明:* key提取器,根据输入的数据,获取key* 泛型说明:* @IN : 输入数据类型* @KEY : 输出数据类型(key)* */

2023-08-18 17:24:27 629

原创 4.3、Flink任务怎样读取Kafka中的数据

flink1.17 读取kafka 数据

2023-08-11 18:14:52 8634 3

原创 4.2、Flink任务怎样读取文件中的数据

读取文件时可以设置哪些规则呢?1. 文件的格式(txt、csv、二进制...)2. 文件的分隔符(按\n 分割)3. 是否需要监控文件变化(一次读取、持续读取)基于以上规则,Flink为我们提供了非常灵活的 读取文件的方法。

2023-08-09 18:29:22 2653

原创 4.1、Flink任务怎样读取集合中的数据

Flink任务读取集合中的数据

2023-08-09 17:05:47 1206

原创 4.5、Flink 自定义源算子之 读取MySQL

flink 读取 mysql (通过自定义源算子)

2023-06-29 18:50:03 1132

原创 4.4、Flink任务中如何使用DataGeneratorSource生成测试数据源

Flink任务中如何使用DataGeneratorSource生成测试数据源

2023-06-29 17:07:53 2178 1

原创 手把手教你 在华为云服务器上部署MySQL服务

在华为云服务器(Linux CentOS-8)上部署MySQL服务

2023-06-28 15:32:49 6780

原创 yum命令 安装lrzsz

yum命令 安装lrzsz

2023-06-27 18:41:56 1949

原创 Linux修改hostname命令

Linux修改hostname命令

2023-06-27 17:42:25 995

原创 3、flink计算任务在运行时可以选择哪些执行模式

1、什么是有界流、无界流2、Flink中的批执行模式、流执行模式

2023-06-26 23:02:18 1097

原创 那些年使用过的正则表达式

正则表达式使用示例

2023-05-10 10:51:33 109

原创 思考: 为什么 Flink 要弃用Scala API呢?

思考: 为什么 Flink 要弃用Scala API呢?

2023-03-31 17:17:00 1472 1

原创 4、如何在flink任务中读取外部数据源(DataStream API)

用一个例子告诉你 怎样在Flink DataStream API 中读取数据源(Scala API)

2023-03-31 15:26:39 2632

原创 1、 怎样使用Java代码来编写Flink流式计算任务

1. 获取 flink应用程序 的执行环境对象(Execution Environment)3. 定义基于数据的转换操作(Transformations)4. 定义计算结果的输出位置(Sink)2. 指定读取数据源(Source)5. 触发程序执行(Execute)

2023-03-29 20:11:14 1232

原创 2、flink计算任务可以在哪些环境中运行

用一个例子告诉你 怎样Flink DataStream API 中获取执行环境对象

2023-03-29 19:06:17 893

原创 Flink 读取HDFS 报错: Caused by: org.apache.flink.runtime.JobException: Recovery is suppressed by NoResta

Flink 读取HDFS 报错: Caused by: org.apache.flink.runtime.JobException: Recovery is suppressed by NoRestartBackoffTimeStrategy

2023-03-29 15:31:53 1177

原创 HDFS 常用 shell命令

HDFS 常用 shell命令

2023-03-29 14:56:04 2099

原创 HDFS API 操作(Scala&Java版本)

HDFS API 操作(Scala&Java版本)

2023-03-28 20:15:07 614

原创 hdfs API 上传文件报错: File /dawang/3.txt could only be written to 0 of the 1 minReplication nodes.

使用 HDFS 的Java API 上传文件时,报错:File /dawang/3.txt could only be written to 0 of the 1 minReplication nodes. There are 1 datanode(s) running and 1 node(s) are excluded in this operation. 无法与 DataNode服务 通信,导致写流程报错1. 开放 9866 端口 2. 在 IDEA 项目的resources目录下添加 hdfs

2023-03-28 18:25:40 551 1

原创 hdfs 创建目录报错: Permission denied: user=worker01, access=WRITE

hdfs 创建目录报错: Permission denied: user=worker01, access=WRITE

2023-03-28 17:28:01 615

Flink 读取 socket 流 (scala 源码)

Flink 读取 socket 流 (scala 源码)

2023-06-29

Flink 读取 HDFS数据 (scala源码)

Flink 读取 HDFS数据 (scala源码)

2023-06-29

flink 读取 kafka (DataStream API scala 源码)

flink 读取 kafka (DataStream API scala 源码)

2023-06-29

Flink 中 DataGen 连接器 来生成测试数据 (scala源代码)

Flink 中 DataGen 连接器 来生成测试数据 (scala源代码)

2023-06-29

Flink 自定义算子 读取MySQL (scala源代码)

Flink 自定义算子 读取MySQL (scala源代码)

2023-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除