自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 问答 (2)
  • 收藏
  • 关注

原创 sql面试题

SQL面试题先按日期分组,求每日总金额(如果每天只有一条记录,这步可以省略)然后使用窗口函数,按日期升序进行累计求和。要实现按日期分组并累计求和金额,可以使用SQL窗口函数。以下是详细的解决方案:SQL实现(推荐使用窗口函数)关键点说明内层查询:先按日期分组计算每日总金额外层查询:使用窗口函数进行累计求和:按日期升序累计默认范围:从第一行到当前行()示例数据结果transaction_datedaily_amountcumulative_amount2023

2025-08-10 15:57:07 476

原创 sql server显示估计的执行计划如何高效使用

轻量优先”:编写/修改查询时,先通过估计计划排除明显问题(表扫描、隐式转换),再用实际计划验证。“聚焦成本”:不纠结低成本节点(<5%),优先解决高成本、有警告的步骤。“结合业务”:执行计划仅反映技术逻辑,需结合业务场景(如数据分布、查询频率)判断优化方向(如高频查询优先加索引,低频大查询优先改逻辑)。通过以上方法,可将“显示估计的执行计划”从“辅助工具”变为“主动优化利器”,大幅提升查询性能优化的效率。下面我将用文字+符号模拟图解。

2025-07-14 22:37:53 824

原创 Hive SQL基础

用于创建、修改和删除表等操作。-- 创建外部表,指向 HDFS 上的数据id INT,-- 修改表结构:添加列-- 删除表。

2025-07-14 22:34:22 278

原创 如何设计星型/雪花模型

事实表是星型模型的“中心”,存储可量化的业务度量(如金额、数量、次数)和维度外键(关联维度表的唯一标识)。粒度:事实表的最细分析单位(必须明确,是建模的基础)。例如“每笔订单的每个商品”“每天的门店销售额”。度量值:可计算的数值,分为“可加性”(如销售额、数量,可跨维度汇总)、“半加性”(如账户余额,仅可跨部分维度汇总)、“非加性”(如单价、利润率,需聚合计算)。外键:关联各维度表的主键(如时间ID、产品ID、客户ID)。示例:销售事实表(粒度:每笔订单的每个商品)订单商品ID。

2025-07-14 22:32:47 466

原创 SQL Server 常用的时间函数

这些函数可以帮助你在 SQL Server 中高效处理日期和时间数据,包括计算、格式化、时区转换等操作。SQL Server 提供了丰富的时间函数,用于处理日期和时间数据。根据年、月、日创建日期(SQL Server 2012+)。返回当前的 UTC 时间(常用于跨时区数据同步)。提取日期的指定部分(如年、季度、周、小时等)。计算两个日期之间的差值(返回指定单位的数量)。返回日期部分的名称(如月份名、星期名)。返回指定日期所在月份的最后一天。将日期转换为指定格式的字符串。提取日期中的年、月、日。

2025-07-14 22:28:40 418

原创 笛卡尔积是怎么产生的

笛卡尔积(Cartesian Product)是关系型数据库中多表连接时的一种特殊结果,指当两个或多个表进行连接操作时,,则第一个表中的每一行都会与第二个表中的每一行强制匹配,产生的结果集行数是所有表行数的乘积。总之,笛卡尔积是一种特殊的连接结果,需谨慎处理,避免因逻辑疏忽导致性能灾难。永远为真,相当于无连接条件),或连接条件中没有关联两表的字段(如。子句中误将多表条件写成独立判断,导致实际上没有关联关系。(显式交叉连接),此时数据库会默认返回两表的笛卡尔积。,仅对单表过滤,未关联表B)。

2025-07-14 22:27:36 1777

原创 基于MapReduce的计算框架底层逻辑(如Hive)

基于MapReduce的计算框架底层逻辑(如Hive)

2025-07-14 22:26:09 949

原创 大型数据仓库迁移

大型数据仓库迁移

2025-07-14 22:24:07 865

原创 Hive SQL 中的数据倾斜问题

Hive SQL 中的数据倾斜问题

2025-07-14 22:21:45 390

原创 Hive SQL优化是提升大数据处理效率的关键

Hive SQL优化是提升大数据处理效率的关键

2025-07-14 22:19:44 832

原创 常用SQL语句大全

SQL(Structured Query Language)是用于管理和操作关系型数据库的标准化语言。SQL语句可以分为几类,包括数据查询、数据更新、数据插入、数据删除等。假设有两个表:orders(订单信息)和order_items(订单商品信息),它们之间存在关联,order_items表包含了订单的详细商品信息。通常是指包含多个子查询、连接查询、聚合函数等复杂逻辑的SQL语句。6.使用 GROUP BY 对订单进行分组,按照订单ID、订单日期和客户名称进行分组。删除触发器(DROP TRIGGER)

2024-02-21 10:52:26 578

原创 Linux常用命令大全

Linux常用命令大全最近都在和Linux打交道,感觉还不错。我觉得Linux相比windows比较麻烦的就是很多东西都要用命令来控制,当然,这也是很多人喜欢linux的原因,比较短小但却功能强大。我将我了解到的命令列举一下,仅供大家参考:系统信息arch 显示机器的处理器架构uname -m 显示机器的处理器架构uname -r 显示正在使用的内核版本dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI)hdparm -i /dev/hda 罗列一个磁盘的架构特性hdpa

2024-02-20 14:21:04 1062

原创 2021-03-20

anaconda python现提供一些国内的镜像下载地址如下:阿里云:http://mirrors.aliyun.com/pypi/simple/清华:https://pypi.tuna.tsinghua.edu.cn/simple中国科学技术大学 :https://pypi.mirrors.ustc.edu.cn/simple/华中理工大学:http://pypi.hustunique.com/山东理工大学:http://pypi.sdutlinux.org/豆瓣:http://pypi.

2021-03-20 12:48:16 108

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除