- 博客(164)
- 收藏
- 关注
翻译 使用 Apache Gravitino 管理 metalake java api
Apache Gravitino 是一个高性能、地理分布、联合的元数据湖。它直接管理不同来源、类型和地区的元数据。它还为用户提供数据和 AI 资产的统一元数据访问
2024-12-14 22:00:44
145
翻译 Hive4.0 TRANSACTIONAL TABLE 语法以统一 ACID ORC 和 Parquet 支持
HIVEACID 表4.0前是用 TBLPROPERTIES 完成的,但它本质上是脆弱的。“create transactional table”提供了一种标准化语法的方法,并允许将来的兼容性更改以支持 Parquet ACIDv2 表以及 ORC 表
2024-12-14 21:46:02
46
原创 yum doesn‘t have enough cached data to continue问题解决
mv /etc/yum.repos.d /etc/yum.repos.d.bakmkdir /etc/yum.repos.dwget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repoyum clean allyum makecache
2024-08-12 21:14:55
493
原创 数据治理之智能指标管理平台产品设计
产品概述:DataEasyIndex核心功能为指标设计即开发、指标模型创建后自动创建数仓表。是集指标设计、开发、应用、管理、监控于一体的一站式指标管理平台【
2024-05-17 15:07:27
299
原创 智能BI产品设计
以共享单车电子围栏监控系统为例,这里的关键指标有:企业停车时长、企业违停量、热点违停量、热点违停区域、车辆入栏率等。业务理解->构建指标体系->寻找规律(BI分析,发现问题)->提供改进(改进产品、活动运营、改善指标)->数据验证。数据采集------------>数仓建模----------->指标加工---------->数字大屏。数据库系统(生产系统):存储、对公、小微、信用库、其他。数据仓库系统(决策系统):客户、产品、渠道、交易、机构。柱状图、条图、面积图、气泡图、雷达图、词云图。
2024-05-06 21:14:06
1227
原创 Flink ExecutionGraph核心对象
前几篇文章分析了StreamGraph、JobGraph。这篇文章分析JobGraph的下一步ExecutionGraph的核心对象
2022-10-03 15:54:17
564
原创 Flink 资源管理
Flink涉及的资源分为两级:集群资源和Flink自身资源。集群资源管理的是硬件资源,包括CPU、内存、GPU等,由资源管理框架(yarn、k8s、Mesos)来管理,Flink从资源管理框架申请和释放资源
2022-10-03 15:47:46
1443
原创 Flink1.15源码解析之OperatorChain
本文首先总结在什么情况下算子能组成一个operate chain,并根据wordcount代码一步步进入真正判断isChainable进行源码解析(Flink 1.15.2版本)
2022-09-24 17:04:15
719
原创 Elasticsearch 修改源码永久使用白金版功能(企业中稳定运行)
elasticsearch不想申请license使用付费内容,直接在源码中修改逻辑即可永久使用白金版功能
2022-09-22 16:13:28
1184
原创 Flink Unaligned Checkpoint
目前的Checkpoint算法在大多情况下运行良好,然而当作业出现反压时,阻塞式的Barrier对齐反而会加剧作业的反压,甚至导致作业的不稳定。
2022-08-30 16:22:33
856
原创 SpringSecurity入门到精通
Spring Security是Spring家族中的一个安全管理框架,相比另外一个安全框架Shiro,它提供了更丰富的功能,社区资源比Shiro丰富。
2022-08-24 18:27:42
984
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人