roman_日积跬步-终至千里-优快云博客

原创【Flink metric（1）】Flink指标系统的系统性知识：获取metric以及注册自己的metric

【Flink metric】Flink指标系统的系统性知识：以便我们实现特性化数据的指标监控与分析

2024-06-23 22:39:31 2239 1

原创【源码分析】一个flink job的sql到底是如何执行的（一）：flink sql底层是如何调用connector实现物理执行计划的

【源码分析】一个flink job的sql到底是如何执行的（一）：flink sql底层是如何调用connector实现物理执行计划的

2024-01-11 23:12:46 1949

原创【源码解析】flink sql执行源码概述：flink sql执行过程中有哪些阶段，这些阶段的源码大概位置在哪里

本文大致分析了flink sql执行过程中的各个阶段的源码逻辑，这样可以在flink sql执行过程中，能够定位到任务执行的某个阶段的代码大概分布在哪里，为更针对性的分析此阶段的细节逻辑打下基础，比如create 的逻辑是怎么执行的，select的逻辑是怎么生成的，优化逻辑都做了哪些，而这些是接下来的文章要分析的。

2023-12-13 23:20:18 2558 1

原创【性能调优】【离线任务】flink处理离线任务（8000个小文件？200多亿数据量？）稳定性与性能调优探索

【性能调优】【离线任务】flink处理离线任务（8000个小文件？200多亿数据量？）稳定性与性能调优

2023-01-09 23:43:41 2263

原创【性能|优化】TB级flink任务报错分析：Could not compute the container Resource

【性能|优化】TB级flink任务报错分析：Could not compute the container Resource

2022-11-29 00:29:17 2174 2

原创【修改源码】hadoop 3.3.1 failed with status code 401 Response message: Authentication required

本文主要通过修改源码解决hadoop内部通讯鉴权的问题。

2022-09-19 16:00:07 1828 4

原创【运维/安装】Flink + MinIO：实现light-weighting思路下的集群(集群、高可用&&POC、快速搭建)

本文通过使用flink+MinIO安装实现flink standalone的集群模式，实现“轻量化集群”flink集群本身作为计算资源，去执行flink jobMinio 用于存储Flink job产生checkpoint和savepoint、以及存储flink HA的一些信息，也就是作为分布式存储系统。

2022-09-14 21:23:55 6419 19

原创【分析思路】hadoop 3.3.1 bug修复：failed with status code 401 Response message: Authentication required

为了支持国产化，hadoop需要安装3.3.1版本，而客户这边需要安全认证，所以对于hadoop需要做的事是升级到3.3.1版本、支持HA模式、安全认证。本文关注hadoop升级过程、启动中出现的401权限问题。

2022-09-05 21:37:18 1570

原创【模式识别与机器学习（18）】关联规则深入浅出教程

【模式识别与机器学习基础（18）】关联规则深入浅出教程

2025-12-02 20:26:37 347

原创【模式识别与机器学习（17）】聚类分析【2】：高级方法与离群点分析

【模式识别与机器学习（17）】聚类分析教程【2】：高级方法与离群点分析

2025-12-02 20:23:38 328

原创【模式识别与机器学习（16）】聚类分析【1】：基础概念与常见方法

【模式识别与机器学习（16）】聚类分析【1】：基础概念与常见方法

2025-12-02 20:20:57 711

原创【模式识别与机器学习（15）】主成分分析

【模式识别与机器学习（15）】主成分分析

2025-12-02 20:19:19 435

原创【模式识别与机器学习（14）】K-means算法中K值确定教程

【模式识别与机器学习（14）】K-means算法中K值确定教程

2025-12-02 20:17:47 250

原创【模式识别与机器学习（13）】神经网络与深度学习（二）：卷积神经网络、正则化、优化算法、循环神经网络

【模式识别与机器学习（13）】神经网络与深度学习（二）：卷积神经网络、正则化、优化算法、循环神经网络

2025-12-02 20:13:55 1195

原创【模式识别与机器学习（12）】神经网络与深度学习教程-第一部分：核心原理

【模式识别与机器学习（12）】神经网络与深度学习教程-第一部分：核心原理

2025-12-02 20:12:03 633

原创【模式识别与机器学习（11）】数据预处理（第三部分）：高级技术与质量保证

【模式识别与机器学习（11）】数据预处理（第三部分）：高级技术与质量保证

2025-12-02 20:09:26 508

原创【模式识别与机器学习（10）】数据预处理-第二部分：数据预处理核心方法

【模式识别与机器学习（10）】数据预处理-第二部分：数据预处理核心方法

2025-12-02 20:07:10 601

原创【模式识别与机器学习（9）】数据预处理-第一部分：数据基础认知

【模式识别与机器学习（9）】数据预处理-第一部分：数据基础认知

2025-12-02 13:05:16 451

原创【模式识别与机器学习（8）】主要算法与技术（下篇：高级模型与集成方法）之元学习

【模式识别与机器学习（8）】主要算法与技术（下篇：高级模型与集成方法）之元学习

2025-12-02 00:06:55 329

原创【模式识别与机器学习（7）】主要算法与技术（下篇：高级模型与集成方法）之扩展线性模型（Extending Linear Models）

【模式识别与机器学习（7）】主要算法与技术（下篇：高级模型与集成方法）之扩展线性模型（Extending Linear Models）

2025-12-02 00:05:11 471

原创【模式识别与机器学习（6）】主要算法与技术（下篇：高级模型与集成方法）之进化计算（Evolutionary Computation）

【模式识别与机器学习（6）】主要算法与技术（下篇：高级模型与集成方法）之进化计算（Evolutionary Computation）

2025-12-02 00:03:55 539

原创【模式识别与机器学习（4）】主要算法与技术（中篇：概率统计与回归方法）之线性回归模型

【模式识别与机器学习（4）】主要算法与技术（中篇：概率统计与回归方法）之线性回归模型

2025-12-01 23:47:02 880

原创【模式识别与机器学习（5）】主要算法与技术（中篇：概率统计与回归方法）之逻辑回归（Logistic Regression）

【模式识别与机器学习（5）】主要算法与技术（中篇：概率统计与回归方法）之逻辑回归（Logistic Regression）

2025-12-01 23:44:24 783

原创【模式识别与机器学习（3）】主要算法与技术（中篇：概率统计与回归方法）之贝叶斯方法（Bayesian）

【模式识别与机器学习（3）】主要算法与技术（中篇：概率统计与回归方法）之贝叶斯方法（Bayesian）

2025-12-01 23:41:52 767

原创【模式识别与机器学习（2）】主要算法与技术教程（上篇：基础分类算法）

【模式识别与机器学习（2）】主要算法与技术教程（上篇：基础分类算法）

2025-11-30 23:32:20 1101

关键词：时空特征组合、向量表示、模式类、信息表征模式是模式识别领域的基础概念。广义地说，模式是指区别事物的时空特征组合，存在于时间和空间中可观察的物体，只要我们能够区别它们是否相同或相似，都可以称之为模式。从信息的角度来看，模式不是事物本身，而是从事物获得的信息。这种信息往往具有时间和空间的分布特性，比如个人的照片所包含的像素信息，歌曲旋律所体现的音阶变化，以及动物步态所反映的运动特征。这些信息通过特定的方式组织起来，形成了我们能够识别和区分的模式。在数学上，模式一般用向量来表示。

2025-11-30 11:11:06 951

原创【模式识别与机器学习（19）】AdaBoost算法：集成学习的基本原理与AdaBoost算法的应用

【模式识别与机器学习】AdaBoost算法：集成学习的基本原理与AdaBoost算法的应用

2025-11-30 09:19:31 916

原创【AI Engineering】什么是Agent？如何构建和评估AI Agent？

【AI Engineering】什么是Agent？如何构建和评估AI Agent？

2025-11-29 11:05:58 548

原创【Starrocks】以库为单位StarRocks数据迁移实战

以库为单位StarRocks数据迁移实战

2025-11-28 17:47:01 376

原创【NL2sql论文】SQL-R1论文深度分析：用强化学习训练NL2SQL：SQL-R1如何用5K数据达到SOTA性能

用强化学习训练NL2SQL：SQL-R1如何用5K数据达到SOTA性能

2025-11-25 23:48:17 953

原创【强化学习基础（6）】强化学习的应用：从游戏到机器人

【强化学习基础（6）】强化学习的应用：从游戏到机器人

2025-11-25 22:58:56 1000

原创【Docker】StarRocks 容器优雅停机与 PID 文件管理解决方案

【Docker】StarRocks 容器优雅停机与 PID 文件管理解决方案

2025-11-25 19:39:47 790

原创【Docker】Docker Stop 后到底发生了什么？——从信号机制到优雅停机

【Docker】Docker Stop 后到底发生了什么？——从信号机制到优雅停机

2025-11-25 16:48:30 752

原创【强化学习基础（5）】策略搜索与学徒学习：从专家行为中学习加速学习过程

【强化学习基础（5）】策略搜索与学徒学习：从专家行为中学习加速学习过程

2025-11-25 13:20:32 604

原创【强化学习基础（4）】强化学习中的泛化：函数近似与深度强化学习

【强化学习基础（4）】强化学习中的泛化：函数近似与深度强化学习

2025-11-25 13:13:09 719

原创【强化学习基础（3）】主动强化学习：不仅要评估还要决策，探索与利用的平衡

【强化学习基础（3）】主动强化学习：不仅要评估还要决策，探索与利用的平衡

2025-11-25 13:06:31 1014

原创【强化学习基础（2）】被动强化学习：学习价值函数

被动强化学习（Passive Reinforcement Learning）是指智能体有一个固定的策略π(s)，它按照这个策略行动，学习状态的价值函数U(s)。价值函数表示"从状态s开始，按照策略π，期望能获得多少累积奖励"。在被动学习中，智能体不知道环境的转移模型P(s’|s, a)和奖励函数R(s, a, s’)。它只能通过观察来学习：执行动作，观察结果状态和奖励，然后更新对状态价值的估计。这就像你按照既定路线开车，不知道路况如何，只能通过实际开车来观察"这条路好不好走"。

2025-11-25 12:57:34 515

原创【强化学习基础】强化学习概念：从奖励中学习

【强化学习基础】强化学习概念：从奖励中学习

2025-11-24 23:47:28 763

原创【AI Engineering】为什么RAG有效？RAG策略与实践指南

【AI Engineering:】为什么RAG有效？RAG策略与实践指南

2025-11-24 23:08:50 44

原创【AI Engineering】提示工程最佳实践——从基础到高级的完整指南

【AI Engineering】提示工程最佳实践——从基础到高级的完整指南

2025-11-23 15:37:37 51

Lambda Architecture – Realtime Data Processing paper

适用于linux的oracle 客户端包

flink on yarn 模式下，flink 1.12.5版本运行所需完整lib包

空空如也