宇宙的尽头是PYTHON-优快云博客

原创数据库的事务

事务（Transaction）是数据库中一组不可分割的操作单元，它将多个数据库操作（如插入INSERT、更新UPDATE、删除DELETE）打包成一个 “整体”，要么所有操作全部成功执行并永久生效，要么在任意一步出现错误时全部撤销（回滚），最终确保数据库从 “一个一致状态” 平稳过渡到 “另一个一致状态”，避免因 “部分操作成功、部分操作失败” 导致的数据混乱（如转账时 “扣了钱却没到账”）。

2025-10-04 14:46:36 128

原创 join left join right join 关联问题

【代码】join left join right join 关联问题。

2025-09-29 17:09:04 182

注意 “范围查询” 的影响联合索引中，如果某个字段用了范围查询（>, <, >=, <=），则该字段右侧的所有字段无法再利用索引。避免与单一索引重复如果已创建 (age, city) 联合索引，无需再单独创建 age 单一索引 —— 因为 (age, city) 已能覆盖 age 的查询场景（最左前缀原则），重复创建会浪费存储空间。如果把表看作一本电话薄，单一索引就是按照名字查询，联合索引就是按照省份城市街道查询，后者在多条件查询下比前者更快更精准。

2025-09-28 16:43:31 227

原创用生活中的实例解释java的类class和方法public static void main

欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入MarkdownText-to-HTMLAuthorsJohnLuke。

2025-09-28 15:23:04 1050

原创 sql的自连接，是不是每个人都应该会的？？刚毕业的应该会？入门级的考题？？？

sql的复杂题型

2025-08-08 12:02:27 197

转载 scala,spark环境变量的配置

转载步骤

2025-07-01 10:19:55 60

原创彻底删除oracle

这是因为卸载程序时，仅通过控制面板删除了可见软件文件，但 Oracle 的服务、注册表残留、安装目录等未彻底清理，导致系统仍能检测到 “已存在 Oracle 数据库服务”，常见残留场景和解决方法如下：一、残留场景及原因服务残留Oracle 安装时会注册系统服务（如 OracleServiceXE 这类命名的服务），卸载程序可能没彻底删除这些服务。可通过Win + R 输入 services.msc 回车，在服务列表里搜索 “Oracle” 相关名称，确认是否有残留服务。按上述方法打开 service

2025-06-10 16:28:14 1265

原创 Oracle部分知识总结

1 oracle的语句为什么要用 commit 提交2 Oracle里存在完全重复的列，应该怎么去重？参考文章https://blog.youkuaiyun.com/yali1990515/article/details/46874511https://cloud.tencent.com/developer/article/2074851你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。我们对

2025-01-10 23:25:28 607

原创 doris删除语句

后端

2024-06-01 12:22:16 1183

原创 a表存在b表不存在的数据

第二种：在卡法中最常见的left join 方法，实现数据的过滤。

2024-05-07 21:00:06 406

原创日期维度的创建

from cn_ads_dev_dl_tables.ads_sc_repl_cloud_monitor_recap_df where ts = ‘2024-04-23’ – 旧数据。from cn_ads_dev_dl_tmp.ads_sc_repl_cloud_monitor_recap_fc_df_tmp501 – 新数据。

2024-05-07 20:58:39 534

原创全字段比对的sql

【代码】全字段比对的sql。

2024-05-07 20:58:00 621

原创 sql练习题

欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入MarkdownText-to-HTMLAuthorsJohnLuke。

2024-01-28 15:56:49 837

原创 onedata数据建模

转载地址经验总结，收获。

2024-01-25 09:23:55 482

原创 oracle的to_char函数

转载地址。

2024-01-17 18:27:04 472

原创数据倾斜的原理和解决方案

第一，在做Join关联的时候其中一个表比较小，但是key集中，会导致分发到某一个或者几个reduce,stage上的数据远远高于平均值。第二，大表和大表关联时，分桶的判断字段0值或者空值太多，这些空值会由一个reduce，stage来处理，非常慢。第四，count distinct 某特殊值过多，处理此特殊值的reduce stage非常耗时。第三，groupby 的时候维度过小，某值的数量过多，处理某值的reduce非常耗时。

2024-01-09 11:02:52 442

原创 id-mapping介绍

缓慢变化维是在维表设计中常见的一种方式，维度并不是不变的，随时间也会发生缓慢变化。如用户的手机号、邮箱等信息可能会随用户的状态变化而改变，再如商品的价格也会随时间变化而调整上架的价格。因此在设计用户、商品等维表时会考虑用缓慢变化维来开发。同样，在设计ID-Mapping表时，由于一个用户可以在多个设备上登录，一个设备也能被多个用户登录，所以考虑用缓慢变化维表来记录这种不同时间点的状态变化（图3-9）。对于该拉链表，可查看某日（如20190801）的快照数据。

2023-12-08 15:44:42 643

原创 in和exists的区别和关系

in exists 效率

2023-11-29 18:10:42 486

原创 sqoop的全量增量导入数据

查看hdfs 上的文件[root@hadoop161 ~]# hadoop fs -ls /user/hive/warehouse/bilibili[root@hadoop161 ~]# hadoop fs -cat /user/hive/warehouse/bilibili/part-*复制表结构到HIVE,同时复制全量数据sqoop import–connect jdbc:mysql://hadoop161:3306/datax –username clds –password clds –t

2023-11-16 09:52:34 178

原创 sql的最优解

【代码】sql的最优解。

2023-07-19 18:32:30 109

原创行转列，列转行，新的理解

题目求语文课程成绩大于英语课程成绩的学生的学号。

2023-07-19 16:43:20 119

原创连续登陆问题,分组问题

连续登陆

2023-07-19 14:36:35 134

原创 mapjoin相关问题

mapjoin的基本原理是：在小数据量情况下，SQL会将用户指定的小表全部加载到执行join操作的程序的内存中，从而加快join的执行速度。当一个大表和一个或多个小表做join时，可以使用mapjoin，性能比普通的join要快很多。如果使用mapjoin，则所有小表占用的内存总和不得超过512MB；在mapjoin中，可以使用不等值连接或者使用or连接多个条件；多个表join时，最左边的两个表不能同时是mapjoin的表。使用mapjoin时需要引用小表或是子查询时，需要引用别名；

2023-06-20 16:25:11 637