第七周翻译(Stairway to T-SQL DML Level 7: Summarizing Data Using a Simple GROUP BY Clause)

本文介绍了如何使用SQL Server中的T-SQL方言通过简单的GROUP BY子句来汇总数据。包括按单列、多列及表达式分组数据的方法,并探讨了HAVING子句的应用。


通向T-SQLDML7级的楼梯:使用简单的GROUP BY子句汇总数据。

本文是“Stairway系列:T-SQL DML的阶梯的一部分

此阶梯将为您提供如何使用SQLServerTransact-SQL(T-SQL)方言处理来自SQLServer表的数据的基本理解。DML是一种数据操作语言,是处理数据的语言的一个方面。它包括语句的选择、插入、更新和删除等,它还提供了一些sql语言的历史和一些关于集合论的概念,每个层次都会建立在前面的水平之上,所以当您完成后,您就会对如何从SQL中选择和修改数据进行了很好的理解。

在楼梯6中,我向您展示了如何使用ORDERBY子句对数据进行排序。这使您可以根据单个或多个列按排序顺序组织详细记录。如果要查看特定记录中的数据,详细数据是很好的,但有时需要将详细数据汇总为汇总值。总结数据时,您可以使用GROUP BY子句完成的数据。

有两种类型的组分句。一个被称为简单的GROUPBY子句,另一个提供了比简单摘要更多的内容,这就是所谓的GROUPBY子句。这两种类型之间的主要区别是简单组BY仅包含GROUP BY子句,而常规GROUP BY子句包含其他操作符,如ROLUPCUBE

在本文中,我将介绍如何使用简单的GROUPBY子句对数据进行分组。在一篇后续文章中,我将逐条讨论更为复杂的一般GROUP BY子句。

简单的GROUPBY子句

使用简单的GROUP BY子句,可以根据单个列、多个列或表达式聚合数据。将根据GROUP BY子句中指定的列和/或表达式,为每个唯一值返回一个汇总行。当SQLServer处理GROUP BY子句时,它会根据唯一的列或表达式值对详细记录进行分组,然后根据SELECT列表中包含的聚合函数汇总每个集合。

为了更好地掌握如何使用GROUP BY,让我们假设您有一个包含不同商店的详细销售信息的表,并且您希望按商店汇总总销售额。可以使用GROUP BY子句汇总每个商店的总销售额。在本例中,要分组的唯一列是商店名称,要聚合的列是销售额。您的结果将显示每个唯一存储名的一行,而每个存储的行将包含该存储的销售金额之和。

SQLServer在按查询在组的选择列表中包含哪些列方面有一些限制。在GROUP BY查询的SELECT列表中指定的每一列都需要归入下列类别之一:

  • GROUP BY子句中指定的列。

  • GROUP BY子句中指定的表达式。

  • 从聚合函数返回的值

    如果某列不属于这些类别之一,则在尝试按查询运行组时会出现错误。注意,包含在GROUPBY子句中的列或表达式不需要在SELECT列表中。

    让我通过几个例子来帮助演示如何使用简单的GROUPBY子句获得汇总的值。

用于探索简单GROUPBY子句的示例数据

为了演示怎样使用简单的GROUPBY子句,我需要构建一些示例数据。我提供了一个脚本来创建我的示例数据,这样您就可以运行本文中提供的示例代码。将脚本使用清单1生成和填充示例表。

清单1:创建示例数据的脚本

如果您查看清单1中的脚本,您会发现我创建了dboSalesTransaction表。然后,我将一些记录插入到这个表中。我将使用这个表来演示如何使用一个简单的GROUP BY子句来聚合数据。

按单列分组

使用清单1创建的示例表,第一个示例将使用GROUPBY子句根据单个列总结数据。清单2中的示例总结了基于 StoreName列。

 

清单2:基于Single列的GROUP BY

当清单2中的代码在我的示例表中执行时,将返回报告1中的以下汇总行。

 

报告1:基于单个列汇总样本数据。

如果您检查报告1中的输出,您可以看到,只有一个聚合行被返回,以获得每个独特的StoreName值。每个记录的StoreSalesAmount都是通过使用SUM函数将每个商店的销售记录的TotalSalesAmount列相加来计算的。

 

按多列分组

有时,您需要开发一个报表,其中您的数据需要按多个列分组。为了实现这一点,您所需要做的就是向GROUPBY子句添加额外的列。当在GROUPBY子句中指定多个列时,SQLServer将根据GROUPBY子句中每个值的唯一组合聚合详细的行。在清单3中,我扩展了清单2中的查询,向GROUPBY子句中添加了第二列。

 

清单3: 基于Single列的GROUP BY

当我根据我的示例数据运行清单3中的代码时,我得到了报告2中的结果。

 

报告2:运行清单1的输出。

在报告2中,您可以看到StoreSalesAmount现在总结为StoreNameSalesTypeDesc级别。还要注意,返回的聚合行不是按照GROUP BY子句中列的顺序排序的。如果我希望汇总数据以StoreName顺序出现,那么我将需要在SELECT语句中包含order BY子句。我将保留给您,将ORDER BY添加到清单3中的代码中,以StoreName顺序返回汇总数据。

GROUP BY子句中使用表达式。

有时,您可能希望将数据分组,而不是特定的列或列集。例如,您可能希望根据一些VARCHAR列的前几个字符,或者仅仅是日期,或DATETIME列的月份来总结您的数据。SQL Server允许您在GROUP BY子句中指定表达式来完成此操作。表达式可以是基于正在聚合的详细记录集中的列的任何有效表达式。为了演示如何在GROUP BY子句中使用表达式,请查看清单4中的代码。

 

清单4:基于单个列的组。

在清单4中,SELECT语句将基于表达式的数据分组,在本例中为转换函数。如果在GROUP BY子句中使用表达式,则必须在SELECT列表中使用相同的表达式。CONVERT函数将解析SalesDateTime列,并只返回该列的日期部分。使用GROUP BY子句中的CONVERT函数,可以根据不同销售记录的实际日期对销售数据进行汇总。通过这样做,我可以总结我的示例,以获得所有商店的总销售额,如报告3所示。

 

报告3:根据表达式汇总数据时输出。

使用表达式可以让您以编程方式识别您的详细数据的哪些部分将被用于聚合数据。

 

HAVING子句

如果您使用GROUP BY子句聚合数据,您可能希望不返回所有聚合的值。相反,您可能只想返回聚合值的一个子集。可以使用HAVING子句来选择性地识别您想要从组中返回的聚合值。

通常,当我们选择数据时,我们使用WHERE子句来限制返回的行。惟一的问题是WHERE子句操作行值,而不是聚合值。因此,WHERE子句不能使用GROUP by子句创建的聚合值。但是,在GROUP BY子句后面添加一个HAVING子句为您提供了一种指定条件来确定您想要返回的特定汇总值的方法。为了更好地理解这一点,我来举几个例子。

在查看商店销售数据时,有一个常见的条款可能用于确定没有达到特定销售限额的商店。如果您想找到所有不满足最低销售金额的商店,您可以使用清单5中的代码来实现。

 

清单5:使用HAVING子句限制结果集。

在清单5中,我将结果集限制为聚合TotalSalesAmount小于1000.00的商店。在我这个简单的例子中,您会发现计算机书籍和软件StoreName是唯一一个没有达到$1000.00的销售配额数量的商店。

HAVING子句可以用于未聚合的列。如果您希望根据GROUP BY子句中使用的任何列的特定值来限制返回的行,那么您也可以这样做,清单6演示了这一点。

清单6:根据GROUPBY列限制结果集

在清单6中,如果只想查看商店名称中包含“Outlet”“Books”的商店的汇总数据。此示例还说明您可以在HAVING子句中拥有多个条件。另一种考虑WHEREHAVING之间区别的方法是WHERE子句在聚合数据之前过滤出数据行,而HAVING子句在应用GROUP BY之后过滤掉聚合行。

用简单的GROUP BY子句汇总数据。

在本文中,我向您展示了如何使用简单的GROUP BY子句来总结您的数据。我讨论了如何使用单个列、多个列以及GROUP BY子句中的表达式来总结详细数据。通过使用我所演示的内容,您现在应该能够构建一个简单的GROUP By子句来总结您的数据,并且可以选择使用HAVING来过滤汇总数据。

在我的下一篇文章中,我将扩展我对GROUP BY子句的讨论。在这篇后续文章中,我将向您展示如何使用多维数据集和ROLLUP操作符来生成额外的汇总数据,如小计和总值。

内容概要:本文是一份针对2025年中国企业品牌传播环境撰写的《全网媒体发稿白皮书》,聚焦企业媒体发稿的策略制定、渠道选择与效果评估难题。通过分析当前企业面临的资源分散、内容同质、效果难量化等核心痛点,系统性地介绍了新闻媒体、央媒、地方官媒和自媒体四大渠道的特点与适用场景,并深度融合“传声港”AI驱动的新媒体平台能力,提出“策略+工具+落地”的一体化解决方案。白皮书详细阐述了传声港在资源整合、AI智能匹配、舆情监测、合规审核及全链路效果追踪方面的技术优势,构建了涵盖曝光、互动、转化与品牌影响力的多维评估体系,并通过快消、科技、零售等行业的实战案例验证其有效性。最后,提出了按企业发展阶段和营销节点定制的媒体组合策略,强调本土化传播与政府关系协同的重要性,助力企业实现品牌声量与实际转化的双重增长。; 适合人群:企业市场部负责人、品牌方管理者、公关传播从业者及从事数字营销的相关人员,尤其适用于初创期至成熟期不同发展阶段的企业决策者。; 使用场景及目标:①帮助企业科学制定媒体发稿策略,优化预算分配;②解决渠道对接繁琐、投放不精准、效果不可衡量等问题;③指导企业在重大营销节点(如春节、双11)开展高效传播;④提升品牌权威性、区域渗透力与危机应对能力; 阅读建议:建议结合自身企业所处阶段和发展目标,参考文中提供的“传声港服务组合”与“预算分配建议”进行策略匹配,同时重视AI工具在投放、监测与优化中的实际应用,定期复盘数据以实现持续迭代。
先展示下效果 https://pan.quark.cn/s/987bb7a43dd9 VeighNa - By Traders, For Traders, AI-Powered. Want to read this in english ? Go here VeighNa是一套基于Python的开源量化交易系统开发框架,在开源社区持续不断的贡献下一步步成长为多功能量化交易平台,自发布以来已经积累了众多来自金融机构或相关领域的用户,包括私募基金、证券公司、期货公司等。 在使用VeighNa进行二次开发(策略、模块等)的过程中有任何疑问,请查看VeighNa项目文档,如果无法解决请前往官方社区论坛的【提问求助】板块寻求帮助,也欢迎在【经验分享】板块分享你的使用心得! 想要获取更多关于VeighNa的资讯信息? 请扫描下方二维码添加小助手加入【VeighNa社区交流微信群】: AI-Powered VeighNa发布十年之际正式推出4.0版本,重磅新增面向AI量化策略的vnpy.alpha模块,为专业量化交易员提供一站式多因子机器学习(ML)策略开发、投研和实盘交易解决方案: :bar_chart: dataset:因子特征工程 * 专为ML算法训练优化设计,支持高效批量特征计算与处理 * 内置丰富的因子特征表达式计算引擎,实现快速一键生成训练数据 * Alpha 158:源于微软Qlib项目的股票市场特征集合,涵盖K线形态、价格趋势、时序波动等多维度量化因子 :bulb: model:预测模型训练 * 提供标准化的ML模型开发模板,大幅简化模型构建与训练流程 * 统一API接口设计,支持无缝切换不同算法进行性能对比测试 * 集成多种主流机器学习算法: * Lass...
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值