T-SQL数据探索与统计及SQL Server自定义聚合
1. T-SQL数据探索与统计基础
数据探索是每个数据科学项目的重要组成部分。缺乏对数据的洞察,我们往往会做出盲目且不准确的估计,无法满足预期和需求。使用T - SQL进行统计可分为三个部分,从简单到复杂逐步深入。
- 描述性统计的聚合函数 :几乎涵盖了所有用于描述性统计的聚合函数,如COUNT和SUM等。通过使用这些函数,我们熟悉了它们的特定用途以及在数据科学中所起的作用,并观察到了它们的常见行为。同时,还详细介绍了SELECT语句中的GROUP BY和GROUP BY GROUPING SETS子句。
- 排名函数及其功能 :引入了排名函数及其功能。借助排名函数,我们还学习了框架(framing)和窗口(windowing)的概念,这有助于我们处理数据集中的数据范围。框架和窗口通常用于运行聚合计算。
- 运行值计算与百分位数统计 :通过结合聚合函数、框架和窗口,给出了许多获取运行值的示例。最后一部分介绍了百分位数统计,它有助于根据数值度量描述记录之间的相互关系,还能定义数据的n分位数。
2. 常见问题解答
以下是一些关于T - SQL数据探索与统计的常见问题及解答:
|问题|解答|
|----|----|
|聚合函数如何处理NULL值?|在聚合函数中,NULL值几乎会被忽略。NULL既不是最小值也不是最大值。唯一的例外是COUNT(*)聚合函数,因为它处理的是整条记录。|
|执行聚
超级会员免费看
订阅专栏 解锁全文
3574

被折叠的 条评论
为什么被折叠?



