亲亲菱纱-优快云博客

原创 hive数仓分层

层级简称关键作用粒度说明建议存储周期原始层ODS保留原始业务数据明细15-30天/看磁盘明细层DWD清洗、标准化、去重明细1-2年汇总层DWS多维汇总宽表/指标表主题/部门/时间等长期应用层ADS报表、接口、直接应用维度表/标签/聚合按需维度层DIM辅助分析的维度字典维度唯一性长期。

2025-12-19 12:17:11 633

原创 20251202

DWD层不是原始业务库的简单镜像，而是通过维度建模，清洗、标准化、规范化业务数据，为后续分析场景打下坚实基础。数仓的其它层也有建模需求（但方式各有不同），建模能让数据使用、分析更高效、更便于管理和维护。

2025-12-12 17:07:12 144

是数据仓库领域常用的一种数据组织方式，通常采用“事实表＋维度表”的形式，将数据分为“度量值”和“分析维度”。电商业务中，订单数据是事实表，会员、商品、时间、店铺等信息作为维度表。订单事实表字段：订单编号、会员ID、商品ID、时间ID、订单金额、数量等。商品维度表字段：商品ID、商品名称、类别、品牌等。时间维度表字段：时间ID、日期、星期、月份等。它们不冲突，是不同需求下的两种实现方式，实际项目中往往结合使用。

2025-12-12 16:22:08 669

原创 Java复习文档

封装：通过访问控制，保障敏感数据安全，规范数据被操作的方式，外部无法随意访问或修改内部状态。（用private保护成员变量，通过public方法访问。继承：代码复用，实现结构化分类，方便扩展新类型。（Manager类通过extends继承Employee类的方法和属性。多态：让代码更通用，主程序可以只关注共性逻辑，具体差异自动处理，扩展性优秀。（父类引用指向子类对象，调用的是子类重写后的方法。

2025-12-12 14:46:14 208

原创关于Linux、Hadoop、Hive、FineBI的介绍

关于Linux、Hadoop、Hive、FineBI的介绍可以在哔哩哔哩搜索up：黑马程序员，看他的《黑马程序员大数据Hadoop入门视频教程，适合零基础自学的大数据Hadoop教程》

2025-07-27 17:20:23 135

原创关于DolphinScheduler的介绍

关于oozie的介绍可以在哔哩哔哩搜索up：黑马程序员，看他的《大数据技术之DolphinScheduler2.x》

2025-07-18 22:00:00 96

原创关于oozie的介绍

关于oozie的介绍可以在哔哩哔哩搜索up：黑马程序员，看他的《大数据生态圈辅助工具Oozie丨实现企业级自动化任务开发》

2025-07-18 18:14:55 100

原创关于CDH以及HUE以及 impala 的介绍

CDH以及HUE的介绍在下面视频中。

2025-07-17 15:59:33 176

原创数仓面试题

4.hive的row_number()、rank()和dense_rank()的区别以及具体使用。1.order by和sort by的区别。3.Hive内部表和外部表的区别。2.什么是分区和分桶。5.hive面试题1。6.hive面试题2。

2025-07-15 23:42:03 143

原创 hive on spark 写的是不是 hive sql 呢？不是sparksql吧

2025-07-15 17:04:37 106

原创 hive on spark 可以同时使用 hive引擎和 spark引擎吗，还是说只能使用spark引擎

2025-07-15 16:50:22 388

原创 Tez 与hive是什么关系

图1图2。

2025-07-15 16:44:09 156

原创 2025年的企业用的更多的是hive还是spark

2025-07-15 16:38:20 124

原创 oltp系统中的数据库的设计严格遵守第三范式，具体怎么理解呢

虽然3NF在OLTP中很重要，但有时会根据实际情况做适当调整(如适度冗余以提高性能)，这需要在。订单表(订单ID, 客户ID, 客户名称, 客户地址, 产品ID, 数量, 单价)：将数据分解为多个关联表，例如：订单系统中客户信息、产品信息、订单信息分别在三个表中存储。：通过外键约束维护关系完整性，避免更新异常(修改一处即可，不需要多处修改)问题：客户名称和地址依赖于客户ID，而不是直接依赖于订单ID。订单表(订单ID, 客户ID, 产品ID, 数量, 单价)客户表(客户ID, 客户名称, 客户地址)

2025-07-04 17:51:45 154

原创手撕22_简单题_49. 字母异位词分组

【代码】手撕22_简单题_49. 字母异位词分组。

2024-04-25 00:28:21 188

原创手撕21_简单题_14. 最长公共前缀

【代码】手撕20_简单题_14. 最长公共前缀。

2024-04-25 00:04:44 178

原创手撕20_简单题_202. 快乐数

【代码】手撕20_简单题_202. 快乐数。

2024-04-24 23:51:24 162

原创手撕19_贪心算法_134. 加油站

【代码】手撕19_贪心算法_134. 加油站。

2024-04-17 23:53:10 178

原创手撕18_动态规划_416. 分割等和子集

2024-04-17 01:24:14 148

原创手撕17_动态规划_322. 零钱兑换

2024-04-17 00:36:19 141

原创手撕16_动态规划_518. 零钱兑换II

【代码】手撕16_动态规划_53. 最大子数组和。

2024-04-16 00:26:04 139

原创手撕15_动态规划_53. 最大子数组和

2024-04-16 00:15:45 152

原创手撕14_动态规划_300. 最长递增子序列

2024-04-16 00:09:18 145

原创手撕13_回溯_子集II

【代码】手撕13_回溯_子集II。

2024-04-15 01:15:23 135

原创手撕12_回溯_子集

【代码】手撕12_回溯_子集。

2024-04-15 01:09:01 151

原创手撕10_回溯_全排列II

【代码】手撕10_回溯_全排列II。

2024-04-15 00:41:18 161

原创手撕11_回溯_组合

2024-04-15 00:38:38 137

原创手撕9_回溯_全排列

【代码】手撕9_回溯_全排列。

2024-04-14 23:01:57 129

原创手撕8_dfs/bfs_岛屿的最大面积

【代码】手撕8_dfs/bfs_岛屿的最大面积。

2024-04-12 00:58:03 122

原创手撕7_dfs/bfs_岛屿数量

【代码】手撕7_dfs/bfs_岛屿数量。

2024-04-12 00:47:54 153

原创手撕6_滑动窗口_字符串的排列

【代码】手撕6_滑动窗口_字符串的排列。

2024-04-11 08:14:20 159 1

原创手撕5_滑动窗口_最小覆盖子串

【代码】手撕5_滑动窗口_最小覆盖子串。

2024-04-11 00:58:21 188 1

原创手撕4_二分查找

【代码】手撕4_二分查找。

2024-04-10 00:31:48 159 1

原创手撕3_二分查找_在排序数组中查找元素的第一个和最后一个位置

【代码】手撕3_在排序数组中查找元素的第一个和最后一个位置。

2024-04-10 00:17:17 151 1

原创手撕2_滑动窗口_无重复字符的最长子串

abcdb中，窗口正常运行到abcd时，下一个字符为b，b上一次出现在实在窗口里，所以需要把left设置为上一次出现的位置+1的位置，得到新的窗口为cdb，不然你不这样设置，窗口里有重复的字符（bcdb），不符合窗口的定义。若被判断的字符上一次出现的位置就在滑动窗口内，即 [ i，j ] 内，则需要left改变位置，改变为该字符上次出现位置+1。我们通过窗口的左界和右界控制窗口。右界不用特意操作，因为它是+1，+1地涨上去，记得在循环里+1就好。左界：每当有一个字符曾经出现过，就需要判断左界。

2024-04-09 01:35:17 227 1