frimiku-优快云博客

原创 Flink CEP

根据业务需求，在Flink的DataStream API上定义出复杂事件的模式条件。①: 量词不和not连用②：greedy 之后不能接 optional③：notFollowedBy不能是规则的最后部分@Data@ToString// 模拟天气数据// 区域// 温度// 数据生成时间@Data@ToString// 模拟机箱数据// 机箱// 温度。

2025-06-29 17:14:44 1055

原创 ClickHouse讲解

ClickHouse 和 MySql 一样存在多个引擎。

2025-05-25 09:17:50 1330

对三根长度分别为10、24、15的木棒来说，k=7，即需要至少7段长度相等的木棒，此时可以得到最大长度为6，因为在这种情况下，第一根木棒可以提供10/6=1段、第二根木棒可以提供24/6=4段、第三根木棒可以提供15/6=2段，达到了7段的要求。有三根相邻的柱子，标号分别为A、B、C，A柱子按金字塔状叠放着n个不同大小的圆盘，现在要把所有盘子一个一个移动到柱子C上，并且任何时候同一根柱子上都不能出现大盘子在小盘子上方，请问至少需要多少次移动，并给出具体的移动方案。现在给定一个单峰序列，求峰顶位置的下标。

2025-04-10 10:16:52 666

原创【专题】图论

【一对多】。蓝桥王国有N个建筑和M条单向通道，每条通道都连接两个建筑，每个建筑都有自己的编号，分别为1~N（其中皇宫编号为1）。国王想让小明回答从皇宫到每个建筑的最短路径是多少。第一行输入n，m。第2到M+1行每行有三个正整数u,v,w。表示 u -> v 之间存在一条距离为w的路输出一行，共N个数，分别表示从皇宫到编号为1~N建筑的最短距离。

2025-04-10 10:08:19 633

原创【专题】简单数论

斐波那契数，通常用 F(n) 表示，形成的序列称为斐波那契数列。该数列由 0 和 1 开始，后面的每一项数字都是前面两项数字的和。也就是： F(0) = 0，F(1) = 1 F(n) = F(n - 1) + F(n - 2)，其中 n > 1 给你n ，请计算 F(n)。但是口袋的承重量有限，装的质数的和不能超过 L。将这些质数从小往大输出，然后输出最多能装下的质数的个数，数字之间用换行隔开。给定一个区间 [a,b]，请你求出区间 [a,b] 中所有整数的质因数分解。

2025-04-10 10:07:22 367

原创【专题】进制转换

含义：得到一个十六进制数，并将其转换回整数。函数可以将十进制整数转换为二进制。函数并指定基数为 2。

2025-04-10 10:05:15 277

原创【专题】前缀和+差分

【给定一个长度为n的数组a1,a2,…ana_1, a_2,…a_na1,a2,…an.接下来有q次查询, 每次查询有两个参数l, r.对于每个询问, 请输出al+al+1+…+ara_l+a_{l+1}+…+a_ral+al+1+…+ar链接：https://ac.nowcoder.com/acm/problem/226282来源：牛客网。

2025-04-10 10:03:57 1035

原创【专题】贪心算法

现在知道了汽车核载重量为 w，可供选择的物品的数量 n。每个物品的重量为 gi, 价值为 pi。由于 yyy 是蒟蒻，如果要参加一个比赛必须善始善终，而且不能同一时间参加 2 个及以上的比赛。老师想合理的安排答疑的顺序，使得同学们在课程群里面发消息的时刻之和最小。堆金币的总重量和总价值分别是 mi,vi(1≤mi,vi≤100)。≤1000) 的背包，但并不一定有办法将全部的金币都装进去。老师可以安排答疑的顺序，同学们要依次进入老师办公室答疑。yyy 认为，参加越多的比赛，noip 就能考的越好。

2025-04-10 10:01:59 962

原创【专题】日期时间

2、定义time对象（时，分，秒）3、定义datetime（年，月，日，时，分，秒）4、计算日期和时间差5、计算两个日期之间的天数差6、时间格式化：将日期时间对象格式化为指定格式的字符串。：解析一个按照特定格式的字符串，并将其转换为一个日期时间对象。7、提取日期元素二：题目练习1、判断闰年给定一个年份，判断其是平年还是闰年。（提示：如果年份是400的倍数，或者是4的倍数但不是100的倍数，那么称这个年份为闰年）2、第几天2000 年的 1 月 1 日，是那一年的第 1天。那

2025-04-10 09:59:34 656

原创【专题】搜索题型（BFS+DFS）

都可以抽象成一个。如果满足递归的条件，树枝可以无限增加，直到找到所需要数据为止；如果不满足，树枝则会折断。。：N个数按一定规则全排列，有几种排列方式：N个数里面按一定规则找出k个数的集合：一个N个数的集合里有多少符合条件的子集。

2025-04-10 09:57:37 1064

原创【专题】动态规划

斐波那契数，通常用 F(n) 表示，形成的序列称为斐波那契数列。该数列由 0 和 1 开始，后面的每一项数字都是前面两项数字的和。也就是： F(0) = 0，F(1) = 1 F(n) = F(n - 1) + F(n - 2)，其中 n > 1 给你n ，请计算 F(n) 。动态规划的解题代码块：数据量大的情况由于结果可能很大，因此将结果对10007取模后输出。简单递归的解题代码块：数据量小情况2、数塔《二维》✦✦✦数塔就是由一堆数字组成的塔状结构，其中第一行1个数，第二行2个数，第三行3个数，

2025-04-10 09:55:08 1009

原创 Scala基础语法

通常一行一条命令，。。【导包】，过程中定义函数，也可以在【导包】。

2025-03-07 16:36:21 943

原创大数据技术之HBase操作归纳

步骤一：先点击绿色的小锤子，然后再点击Edit Configurations的选项。Java借助于HBase的API接口来操作HBase。步骤二：进行信息的配置。

2025-02-20 17:09:18 737

原创【Python】Pandas详解

Pandas详解一、Pandas介绍数据分析三剑客之一的Pandas，是基于Numpy构建的，专门用于【数据处理和分析】的库。它提供了两种主要的数据结构：Series（一维数据结构）和DataFrame（二维数据结构，类似于表格），使得数据的清洗、转换、分析和可视化变得更加容易。DataFrame与Series的联系数据结构关系：【DataFrame可以看作是由多个Series组成的】。其中，DataFrame的每一列都可以视为一个Series，这些Series共享相同的索引。相互转换

2025-01-16 10:04:40 2346 1

原创【Python】Numpy详解

数据分析三剑客之一的Numpy，是一个用于处理数组的 Python 包【基于数组对象的科学计算库】。其全名为 “Numeric Python”，是一款开源的Python库。Numpy相当于Python中的列表（List），但只能存放相同的数据类型。引入Numpy的目的是可以计算大型的多维数组和矩阵操作，其计算能力强，运行的速度快。列表（List）需要先寻找元素的地址，再访问到元素；而Numpy的数组被存储在内存中的一个连续的位置【物理地址连续性】，可以非常有效地访问和操作它们。【功能侧重】：主要专注于数值

2025-01-15 10:50:15 1359

原创【Python】Matplotlib详解

plot()函数的基本格式x和y：【必要参数】，分别是横坐标和纵坐标的数据，可以是列表、数组等可迭代对象。如果只提供y，则x默认是从0开始的整数序列。：【可选参数】，用于指定线条的格式，包括颜色、线型、标记等。例如，'r-'表示红色实线，'bo'表示蓝色圆点标记。**kwargs：【可选参数】，用于更详细地设置线条的属性，如线宽、标记大小、颜色等。在实际应用中，常见的参数类型主要有以下几种【额外配置】：color：设置线条颜色，默认为蓝色。linestyle：设置线条样式，默认为实线。

2025-01-14 13:05:44 4318 2

原创 SparkGraphX讲解

Spark GraphX 是一个分布式图处理框架，为图计算和图挖掘提供了简洁易用且丰富多彩的接口。

2024-12-27 10:02:06 1559

原创 Flink CDC

CDC全称是Chanage Data Capture（其核心原理就是，将这些，并将**【捕获到的数据】**写入到消息中间件中。如mysql、kakfa(最为典型)等都能实现CDC的功能。在中，通常使用**Flume（面向文件系统）CDC工具（面向关系型数据库组件）**这两个来实现数据采集和ETL功能。

2024-11-20 21:17:41 1409

原创 Kafka-Eagle(可视化监控平台)安装教程

具体路径：vim /opt/software/kafka_2.12-2.8.0/bin/kafka-server-start.sh。命令：vim /opt/software/efak-web-3.0.1/conf/system-config.properties。将安装包放入master01的/opt/download中，解压缩【在download目录下执行下面两个命令即可】官网地址：https://www.kafka-eagle.org/启动的前提条件是先启动Zookeeper、Kafka。

2024-10-26 10:57:29 1024 1

原创 Flink加载维度数据

在我们构建实时数仓时，不能光有事实数据，也需要加载维度数据来标明这些事实数据的具体含义。若只含有事实数据的话，就相当于只有数据本身在不断地变化，而并不知道这些数据具体表示什么意思。因此，我们应当加载维度数据进来。

2024-09-23 21:26:25 677

原创 Python爬虫（一文通）

Python爬虫（基本篇）一：静态页面爬取Requests库的使用1）基本概念+安装+基本代码格式应用领域：适合处理**静态页面数据和简单的 HTTP 请求响应**。Requests库的讲解含义：requests 库是 Python 中一个非常简单且强大的库，相当于urllib的升级版（此处不对urllib进行讲解），在Cookie，登录验证，代理设置等操作更加的便利。请求头（UA）UA介绍：UA全名是User Agent，中文名为用户代理。它是一个特殊字符串头，使得服务器能够识

2024-08-29 21:24:41 7161 3

原创 Prometheus & Grafana安装及使用教程

Prometheus和Grafana是两个在监控和数据分析领域非常流行的开源工具。PrometheusGrafanaClickHouse V20.1.2.4中内置了 Prometheus 的访问接口（需开启），直接配置 Prometheus 的 Endpoint服务，会自动将metrics，events，aysnchronous_metrics 三张系统表的数据发送给 Prometheus。

2024-08-14 19:09:56 3496 2

原创 Kafka实战（Scala操作）

版本：具体依赖：2、创建生产者（Producer）一：生产者相关配置讲解：：批处理数量，消息为大小，生产者才会发送消息：延迟时间，如果消息大小迟迟不为大小，则可以在指定的时间后发送：重试次数，消息发送失败时，生产者可以再重试次数：ack机制，生产者需要等待个副本成功写入消息后，才认为消息发送成功acks一共有三个选项：键序列化：值序列化二：ProducerRecord讲解：异步发送的普通生产者在异步发送模式下，生产者调用方法发送消息后，不会立即等待服务器的响应，而是继续执行后续操作。异步发送的带

2024-08-03 16:52:38 1319

原创 Kafka基本讲解

Kafka是，主要设计用于高吞吐量的数据处理和消息传输，适用于日志处理、实时数据管道等场景。，用于收集、缓存和分发实时数据流，支持复杂的实时数据处理，实时需求分析，实时报表等应用。

2024-08-02 11:09:47 1806

原创虚拟机处理yum缓存堆积问题

虚拟机用的时间长了，网络不好，yum显示无法安装。此时我们因考虑到Yum软件包管理器的仓库配置文件地方对方太多而导致的问题。一：首先检查虚拟机设置：确保设备状态中的“✔”都打钩上，并且IOS映射文件没有问题。

2024-08-02 09:30:01 496

原创 Hive之扩展函数(UDF)

此处创建的UDF业务功能介绍：给定三个参数，参数一和参数二为日期，参数三为不同维度（年，季度，月，周，日）。根据不同维度计算两日期之间相差的值。UDF基本接口定义//校验:若无法匹配，则抛异常 public interface UDFCom {//校验传参的数量与元素 default void validateArgs(Object [ ] args , int size) throws UDFArgumentException {

2024-07-29 10:00:04 818

原创调度器——DolphinScheduler讲解及安装教程

因 SPRING_DATASOURCE_URL 配置中追加 createDatabaseIfNotExist=true，所以无需手动建库。初始密码：dolphinscheduler123。初始用户：admin。

2024-07-22 19:45:44 1021

原创 Mysql深入讲解（索引、事务、锁机制）

一个索引只包含单个列，而一个表中可含有多个单列索引。

2024-07-20 19:05:22 1122

原创大数据采集工具——Flume简介&安装配置&使用教程

Flume 是一个的，主要用于将大量的数据从（如日志文件、数据库、本地磁盘等）采集到（主要为）中，用来处理日志数据，并支持在数据流中可靠、高效地移动数据。

2024-07-18 21:37:27 2795 1

原创 Spark集群搭建

现有机器：master01，master02，worker01。

2024-07-17 19:12:33 1941

原创 Hive理论讲解

hive理论讲解

2024-07-16 19:40:52 513

原创 Docker基本讲解及演示

Docker是一个开源的应用容器引擎，允许开发者将应用程序及其依赖项打包成一个轻量级、可移植的容器，然后发布到任何支持 Docker 的环境中运行，无论是开发机、测试机还是生产环境。Docker基于沙箱技术，每个容器都有自己的独立运行环境，包括操作系统、库文件、配置等，实现了资源隔离和轻量级迁移。

2024-07-16 09:35:15 1112

原创 Docker的安装【虚拟机】

官网地址：https://cr.console.aliyun.com/cn-hangzhou/instances/mirrors?：从阿里云的镜像站点下载 CentOS 7 的 yum 仓库配置文件，并将其保存到 /etc/yum.repos.d/ 目录下。：当安装docker仓库时，输入命令：yum -y install yum-utils。若出现以下信息，表示安装docker成功！

2024-07-15 19:35:17 822

原创 Hive的基本操作（查询）

查询字段的【数量】与【类型】必须相同，字段名是以【第一张表为准】。union all：合并后保留重复项 ✔。union：合并后删除重复项（去重）

2024-07-15 10:59:50 1418

原创 Scala之OOP讲解

泛型的定义类型参数化，主要用于【集合不同于 Java ，scala中泛型被定义在 [] 中。/*泛型边界定义上边界：T<:A 泛型为某个类型的子类下边界：T>:A 泛型为某个类型的父类*/// 1.只能是比Father小的类型// 2.只能是比Son大的类型。

2024-07-14 14:10:52 1443

原创 Hive表【汇总】

因此分区表将文件切割成更小的粒度，当需要针对局部数据进行检索、聚合等处理时只需要加载对应的粒度即可，从而提高了处理的效率。在开发中，数据量大的情况下，我们为了针对开发做测试，就可以采用分桶来进行数据采样，采样得到的结果是一个具有代表性的查询结果，可以达到快速开发的目的。外部表允许在 Hive 中定义一个表结构，并对外部存储系统中的数据进行查询和分析，而不会对数据本身进行移动或修改。：最后获取的数据是在每个分区【文件夹】内随机抽取指定数量【如：四分之一]的数据[桶]】=> 抽到的数据[桶]是具有。

2024-07-13 10:47:35 1563

原创 Hive的基本操作（创建与修改）

【代码】Hive的基本操作（创建与修改）

2024-07-09 09:42:57 590

原创 Mysql数据库学习

Mysql是一个具体的关系型数据库管理系统（RDBMS），其支持使用SQL来进行数据的增删改查等操作。Mysql具有许多的优势，包括可移植性，安全性，可跨平台等，适用于各个规模的应用和项目。此处所展示的是MySQL数据库基本的系统库注意：当你初次打开MySQL服务时，会看见mysql,performance_schema,sys,information_schema这四个基本的系统库【不可进行删除修改等操作，即：不要动着四个系统库】。2.1解释别名就是非表的原始部分2.2基本语法[as] 表达式别名说明。

2024-06-24 13:52:01 926

原创 Git教程(从0到1)

记录文件状态内容的地方，存储修改的历史记录。

2024-06-12 09:41:10 463

原创错误：case-to-case inheritance is prohibited

不采用case，而是老老实实的构造参数和伴生对象。：样例类不可以作为继承链路中的叶子结点。

2024-04-28 16:46:15 294

空空如也

空空如也