少年阿宏-优快云博客

原创 jedis和lettuce连接驱动的差别

Lettuce基于Netty的多路复用的异步非阻塞的连接方式。2.基于Netty框架的事件驱动通信，可以异步的。Jedis基于TCP的阻塞性的连接方式。3.适合于分布式的缓存。

2023-12-11 22:01:52 569

（6）数据整合：数据源、数据目标、数据转换规则、数据血缘关系、ETL工作流、EAI、Ell、迁移和变换。（8）文档内容管理：非结构化数据、文档、术语分类、本体、命名集合、法律发现、搜索引擎索引。(11)物理数据模型：文件、表、列、视图、业务定义、索引使用、性能、变更管理。〈12）流程模型：职能、活动、角色、输人/输出、工作流、业务规则、定时、存储。（13）系统群和IT治理：数据库、应用程序、项目和计划、整合路线图、变更管理。（5）数据治理：政策、标准、程序、项目、角色、组织和管理职责安排。

2023-12-11 10:28:37 683

原创大数据开发数据治理方向

数据质量合规：1.流程化，任务上线/变更流程，指标变更流程 2.dqc管控：对原4大基础dqc进行补充以及核心业务模型dqc补充，并对原无效dqc下线，对常触发dqc进行调整（例如表行数波动，可通过算法对近7天数据量监测） 3.sla及基线治理（这里也可以放到人员运维roi治理中）：上线前把控，保障基线正常运行，核心任务优先产出且分配高资源，培训及整理值班运维手册，建设容灾备份快恢能力临时修复数据 4.上游问题数据治理：数据质量长期监测体系（详情见课程3-数据质量课件）

2023-11-10 08:58:03 469

原创网易猛犸数据同步任务加参

DB2任务falsespark 加资源。

2023-06-21 10:50:36 379

原创两种不同的oracle jdbc url格式

格式：jdbc:oracle:thin:@ServerIP:Port:SID 或 jdbc:oracle:thin:@//ServerIP:Port/service_name。

2023-05-30 15:37:11 960

原创用excel拼接insert sql语句

【代码】用excel拼接insert sql语句。

2023-05-26 08:39:24 715

原创 jdbc impala on hiv,impala的完整url

【代码】jdbc impala on hiv,impala的完整url。

2023-04-12 09:07:17 241

原创 jdbc impala查询报错， java.sql.SQLException: [Simba][ImpalaJDBCDriver](500051) ERROR processing query/sta

java.sql.SQLException: [Simba][ImpalaJDBCDriver](500051) ERROR processing query/statement. Error Code: java.net.SocketException: Broken pipe (Write failed), SQL state: HY000, Query: select count(*) from

2023-04-11 10:52:29 1869

原创 git 删除提交记录

删除本地最后一条记录，如果需要删除最后提交的N条记录，将“1”替换为一个具体的数字“N”即可。git remote rm origin （删除关联的仓库）右键打开 git bash here。就清除了git版本控制信息。////查看关联的仓库。////删除关联的仓库。

2023-04-04 09:20:50 959

原创 flink catalog

Catalog 使用户能够引用他们数据系统中的现有元数据，并自动将它们映射到Flink的相应元数据。例如，Flink可以将JDBC表自动映射到Flink表，用户不必在Flink中手动重写DDL。或者是永久性的元数据，比如Hive元存储中的元数据。Catalog 提供了一个统一的API来管理元数据，并使其可以从表API和SQL查询中访问。Catalog提供元数据，如数据库、表、分区、视图，以及访问存储在数据库或其他外部系统中的数据所需的函数和信息。它可能是暂时性的元数据，如临时表，或针对表环境注册的。

2023-04-03 16:43:06 377

原创本地maven安装外部jar包

本地maven安装外部jar包命令

2023-02-24 10:01:01 154

原创 hive自定义udf

hive udf

2023-02-16 09:31:51 129

原创 hive自定义函数

hive 自定义udf

2023-01-31 15:30:05 401

原创 flink本地环境idea启动flink程序web ui页面

需要在项目中先导入flink-runtime-web依赖。

2022-12-31 18:17:16 597

原创 linux快速查找某个目录下相应文件内容的文件

grep -rn ‘文件内容’

2022-12-29 16:02:52 180

原创 idea快速查看当前类里面的所有方法和成员变量

idea快速查看当前类里面的所有成员方法和变量

2022-12-22 16:56:14 979

原创 flink-connector-hbase1.4和2.2有什么区别？

flink-connector-hbase 1.4和2.2版本区别

2022-12-06 23:53:58 830

原创 java日志框架sl4j使用

sl4j使用

2022-12-01 14:25:35 964

原创 Kafka 消息过期策略（时间相关参数）

retention.ms=1小时的毫秒数,delete.retention.ms=7天的毫秒数,segment.ms=7天的毫秒数。在这种配置下，retention.ms=1小时的毫秒数生效，kafka offset中数据已经不可见，flink也无法消费到数据。在新建topic的时候附加 retention.ms=1小时的毫秒数这样的配置，背景：在不需要重启kafka的情况下，需要针对特定的topic做消息过期时间配置。（Kafka offset配置）retention.ms。标记delete时效。

2022-11-15 13:58:01 4872

原创 #1024程序员节｜用代码，改变世界#哈哈哈毕业参加工作一年多啦

无

2022-10-24 13:30:03 139

原创 flink sql常用函数

flink sql函数

2022-09-16 11:40:23 5747

原创 flinksql和json对应数据类型转换

无

2022-08-28 10:46:36 1689

转载 Flink SQL 如何解析嵌套的 JSON 数据＜转载＞

flink sql

2022-08-27 23:19:26 1136

原创 doris数据导入方式选择

doris数据导入方式选择

2022-08-25 22:50:53 170

原创 hql创建指定日期表

SELECT DATE_ADD(start_date, pos) ddFROM (SELECT ‘2022-03-01’ AS start_date, ‘2022-03-30’ AS end_date) tempLATERAL VIEWPOSEXPLODE(SPLIT(SPACE(DATEDIFF(end_date, start_date)), ‘’)) tAS pos, val

2022-03-24 16:50:42 231

原创失业两个星期，我好像渐渐明白了生活的真谛

一定要整两三个正经的个人爱好能支撑你度过漫漫人生

2022-01-21 19:27:19 156

原创 hive的groupby,with cube,with rollup

GROUP BY a, b, c WITH CUBE is equivalent toGROUP BY a, b, c GROUPING SETS ( (a, b, c), (a, b), (b, c), (a, c), (a), (b), ©, ( )).ROLLUP clause is used with GROUP BY to compute the aggregate at the hierarchy levels of a dimension.GROUP BY a, b, c with RO

2021-12-23 20:27:45 1081 1

空空如也

空空如也