SQLServer的COUNT()指令

本文详细介绍了SQL Server中COUNT()函数的使用。阐述了COUNT()的完整语法,对比了COUNT(*)与COUNT(expression)的区别,通过实践说明COUNT(*)不一定比COUNT(columnname)慢,还分析了不同情况下应如何选择使用,同时指出COUNT使用不当可能导致结果与预期不同。
在有关SQL Server的讨论中,时常遇到这样一个问题:到底应该使用COUNT(*)还是使用COUNT(columnname),其中columnname是要计算纪录数的列名。一些讨论区和邮件列表给出的建议往往都是使用COUNT(columnname)比使用COUNT(*)更好。但这并不总是对的,有时甚至完全错了。尽管有些场合可以(或者说是应该)使用COUNT(columnname),但不能总是这样使用。给出错误建议的原因可能是人们对SQL Server处理数据的内部机制还缺乏了解。


COUNT()详解

首先要了解使用COUNT()与其它替代方法之间有何不同,以及这个不同的成因。COUNT()的完整语法是:

COUNT ( { [ ALL | DISTINCT ] expression } | * ) )

其中,expression可以是任意表达式,但不能处理唯一标识符,文本,二进制或图像数据,也不能使用聚合函数与子查询。虽然表达式大多都是针对表中的一个列,但ALL是缺省的,所以COUNT(expression)等价于COUNT(ALL expression)。

COUNT(*)返回表的所有纪录数,而COUNT(expression)则返回符合表达式计算结果的非空纪录数。通常情况下,COUNT(DISTINCT expression)将相同的纪录只计算为一个。可以看到,根据不同的COUNT()描述,可以得到不同的查询结果。


实践出真知

如前所说,有人以为COUNT(columnname)比COUNT(*)要快,因为COUNT(*)必须读取所有列的纪录(就象运行SELECT * FROM MYTABLE指令),而COUNT(columnname)只需读取指定列的纪录。这个理解是错误的,有好几个理由。

首先,如果SQL Server不读取整行纪录就无法得到单个列的内容。SQL Server用磁盘上8KB的数据页来储存各行纪录。这些页面中安放一行或多行纪录(取决于每行纪录的大小。在有些意外情况下,一行纪录可能大于8060 字节),当SQL Server要处理这些页面数据时就将数据读到内存(RAM)中。为确定单行(或多行)纪录的值,要将完整的磁盘页读到内存中。这些页面可能已经缓存在内存,这样就会加快运行速度。但SQL仍然要从内存中读取整页的数据来检查一行纪录中的某个列数据。

因为只要求获得纪录数(行数),SQL Server不是读取这些数据页,而是读取索引数据 - 如果有索引的话。索引的存储方法与数据一样,也使用一个8 KB的索引页。索引总是比整行数据要小(索引只包括数列甚至一列的数据),一个索引页可以安放比一个数据页更多行的纪录。这意味着SQL Server用索引页检查纪录数时读取的页面数量比用数据页要少,这是好事。

不但COUNT(索引域名)这样做,COUNT(*)同样也使用索引来计算行数。有时,COUNT(columnname)中指定的列不是索引列,而表中有其它列做索引。在这种情况下,COUNT(*)可以使用索引列来计算纪录数,而COUNT(非索引域名)就不得不通过读取数据页来计算非空纪录数了。


可以用SQL Query

Analyzer来测试下面的脚本(如果测试器未将结果显示设置为文本方式,可按Ctrl-T设置):

USE Northwind
GO
SET STATISTICS IO ON
SELECT COUNT(*) FROM Orders
SELECT COUNT(CustomerId) FROM Orders
SELECT * FROM Orders
SET STATISTICS IO OFF

指令SET STATISTICS IO ON要求SQL Server输出执行查询时所需的I/O使用数量,可以用这个量来比较不同查询语句中的资源使用情况,从而决定该用哪种查询。脚本执行后立即可得到统计结果。这里关心的是读取逻辑和/或物理页的数量。逻辑页是从内存读取数据(数据页和/或索引页)的页面数量,物理页是从磁盘读取的页面数量。在我的机器上用二个COUNT()得到的纪录数都是830,如果从没有在Order表中增删过纪录,那么你也应该得到这个数。现在来看看从运行上述脚本后得到的逻辑页读次数(多运行几次脚本,可以缓存物理页),我的第一条指令读取3次逻辑页,而第二条指令读取了21次逻辑页。因为Order表中的CustomerId列没有建索引,所以第二条指令读取的是数据页,而第一条指令读取的是索引页(我的机器上,Order表有ShippersOrders索引)。


到底用哪条指令好?

如上阐明,用COUNT(*)肯定不会更差。相反,有时用COUNT(expression)反而更差。通常表中都有索引列,所以不会遇到上述问题。但糟糕的是COUNT的使用不当可能得到与预期不同的结果!比方说,一个早期的应用中用COUNT(columnname)来计算指定列的行数,而这个列是不许有空值(NULL)的。后来又把这个列设定为允许空值,这时应用得到的不是整个表的行数,而是表中指定列的非空行数!这可能不是早先设计的目的并可能因此导致大错。


但是...

通常情况下,没有理由不使用COUNT(*)。但正如本文开始所说,有时要(或应该)用COUNT(expression)。一个明显的例子是只想得到指定列的非空行数。另一个特例是在使用COUNT()的同时使用还要用聚合函数。例如,有个表要对数据进行排序,某些行内存在空值(NULL )。现在要求列的平均值。通常可以用AVG()来达到目的。但为了说明问题,我们不使用这个函数。

比较以下二个指令就能看到问题症结所在:

SELECT SUM(column) / COUNT(*) FROM table
SELECT SUM(column) / COUNT(column) FROM table

这二个指令将返回不同的结果。因为SUM()是忽略NULL值的(NULL不按0计算)。如果总数(sum)是1500,行数为150,其中column列有50行纪录为空值,那么,第一条查询指令得到的结果是10(1500/150),而第二条查询指令得到的结果是15(1500/100)。在我的数据库咨询工作中经常遇到这个问题。这也是那些不了解不同聚合函数(如上述的SUM()和COUNT())处理空值的不同方式的SQL程序员所遇到的问题所在。

<think>首先,用户的问题是:“我想了解SQL ServerCOUNT函数的正确使用方法 请问SQL Server COUNT function usage example”。这是一个关于SQL ServerCOUNT函数的查询。 根据系统级指令: - 所有行内数学表达式必须使用$...$格式。 - 独立公式必须使用$$...$$格式并单独成段。 - LaTeX语法正确。 - 使用中文回答。 - 生成相关问题。 - 在回答中引用的段落末尾自然地添加引用标识,如[^1]。 - 回答结构清晰,帮助用户逐步解决问题,保证真实可靠。 用户提供的引用仅供参考,我需要基于这些引用构建回答。引用内容涉及SQL Server的窗口函数、别名问题、ROWCOUNT和分页查询。但用户直接询问的是COUNT函数,所以我应该优先解释COUNT函数,并可能引用相关内容。 关键点: - COUNT函数用于计算行数或非NULL值的数量。 - 基本语法:COUNT(expression) 或 COUNT(*) - 示例:COUNT(*) 计算所有行,COUNT(column_name) 计算指定列非NULL的行数。 参考引用: - 引用[1]提到SQL Server提供分析函数,但没有直接提到COUNT。 - 引用[2]涉及聚合函数中的错误,可能与COUNT相关。 - 引用[3]关于@@ROWCOUNT,类似于行计数。 - 引用[4]关于分页查询,其中可能涉及COUNT来获取总行数。 在回答中,我应该自然地整合引用。例如,在讨论COUNT与@@ROWCOUNT的区别时,可以引用[3]。 回答结构: 1. **介绍COUNT函数**:解释COUNT是什么,为什么用。 2. **语法和参数**:描述COUNT的不同形式。 3. **示例**:提供简单示例代码。 4. **常见用例**:如计算总行数、特定列的非NULL值等。 5. **注意事项**:如与@@ROWCOUNT的区别、别名问题(参考引用[2])、在分页中的应用(参考引用[4])。 6. **总结**。 7. **生成相关问题**:基于主题,生成2-3个问题。 生成相关问题: - 例如:COUNT(*) vs COUNT(1) 有什么区别? - COUNT函数在分页查询中的应用? - 如何优化COUNT查询的性能? 确保使用中文回答。 最后,添加引用标识:在引用内容末尾添加[^1]、[^2]等。引用来自提供的文本,我需要合理使用。 例如: - 在讨论别名问题时,引用[2]。 - 在讨论@@ROWCOUNT时,引用[3]。 - 在讨论分页时,引用[4]。 现在,构建回答大纲: 1. **开头**:简要介绍COUNT函数。 2. **基本用法**:解释COUNT(*)和COUNT(column_name)。 3. **示例**:提供SQL代码示例。 4. **高级用法**:如COUNT与DISTINCT结合。 5. **相关概念**:讨论@@ROWCOUNT(参考引用[3]),别名问题(参考引用[2]),分页(参考引用[4])。 6. **注意事项**:性能考虑等。 7. **结尾**:总结。 8. **相关问题**:生成2-3个问题。 确保回答真实可靠:基于SQL Server知识,COUNT函数是标准SQL函数,用法正确。</think>### SQL ServerCOUNT函数的正确使用方法 COUNT函数是SQL Server中最常用的聚合函数之一,用于统计行数或非NULL值的数量。它在数据分析、报表生成和分页查询中应用广泛。下面我将逐步解释其正确用法,并提供实际示例。回答基于SQL Server的标准语法(兼容T-SQL),并参考了相关文档和最佳实践[^1]。 #### 1. **COUNT函数的基本语法和参数** COUNT函数有三种主要形式: - `COUNT(*)`:统计表中所有行的数量,包括NULL值和重复行。 - `COUNT(column_name)`:统计指定列中非NULL值的数量。 - `COUNT(DISTINCT column_name)`:统计指定列中唯一非NULL值的数量(去重计数)。 参数说明: - `column_name`:表中的列名,可以是任意数据类型。 - 返回值:整数(INT),表示计数值。 - 注意:COUNT是聚合函数,通常与`GROUP BY`子句联用进行分组统计。 #### 2. **正确用法示例** 以下示例基于一个示例表`Employees`,结构如下: ```sql CREATE TABLE Employees ( EmployeeID INT PRIMARY KEY, Name NVARCHAR(50), Department NVARCHAR(50), Salary DECIMAL(10,2) ); ``` 插入测试数据: ```sql INSERT INTO Employees VALUES (1, '张三', '销售', 5000.00), (2, '李四', '销售', NULL), (3, '王五', '技术', 7000.00), (4, '赵六', NULL, 6000.00); ``` **示例1:统计所有行数(使用COUNT(*))** ```sql SELECT COUNT(*) AS TotalEmployees FROM Employees; ``` - 结果:`4`(因为表中有4行,包括NULL值)。 - 应用场景:快速获取表的总行数,常用于分页查询的页码计算[^4]。 **示例2:统计非NULL值的数量(使用COUNT(column_name))** ```sql SELECT COUNT(Department) AS NonNullDepartments FROM Employees; ``` - 结果:`3`(因为`Department`列有1个NULL值)。 - 注意:如果列名与别名冲突,可能引发错误(如引用[2]中提到的别名问题)。 **示例3:分组统计(结合GROUP BY)** ```sql SELECT Department, COUNT(*) AS EmployeeCount FROM Employees GROUP BY Department; ``` - 结果: | Department | EmployeeCount | |------------|---------------| | 销售 | 2 | | 技术 | 1 | | NULL | 1 | - 说明:按部门分组统计员工数,NULL值会被单独分组。 **示例4:去重计数(使用COUNT(DISTINCT))** ```sql SELECT COUNT(DISTINCT Department) AS UniqueDepartments FROM Employees; ``` - 结果:`2`(因为`Department`列的唯一非NULL值有"销售"和"技术")。 - 应用场景:统计唯一值数量,如分析数据分布。 #### 3. **常见注意事项** - **与@@ROWCOUNT的区别**:`COUNT`是聚合函数,用于查询结果;`@@ROWCOUNT`是系统变量,返回上一条语句影响的行数(如INSERT/UPDATE)。例如: ```sql UPDATE Employees SET Salary = Salary * 1.1 WHERE Department = '销售'; SELECT @@ROWCOUNT AS RowsUpdated; -- 返回实际更新的行数 ``` 参考引用[3],`@@ROWCOUNT`常用于验证操作影响的行数。 - **别名问题**:如果列别名与表名或关键字冲突,可能导致错误(如引用[2]中的聚合函数嵌套错误)。建议使用明确的别名: ```sql SELECT COUNT(*) AS TotalCount FROM Employees; -- 正确 -- 避免 SELECT COUNT(*) AS Employees FROM Employees; -- 可能引发歧义 ``` - **性能优化**:在大型表中,`COUNT(*)`通常比`COUNT(column_name)`更快,因为它不检查NULL值。但若需统计非NULL值,应优先使用`COUNT(column_name)`。 - **分页查询中的应用**:COUNT常用于计算总页数(参考引用[4])。例如: ```sql DECLARE @PageSize INT = 2; DECLARE @TotalPages INT; SELECT @TotalPages = CEILING(COUNT(*) / CAST(@PageSize AS FLOAT)) FROM Employees; PRINT @TotalPages; -- 输出: 2(总行数4,每页2行) ``` #### 4. **总结** COUNT函数是SQL Server中高效的计数工具,正确使用可提升查询性能。关键点包括: - 优先用`COUNT(*)`获取总行数。 - 用`COUNT(column_name)`统计非NULL值。 - 结合`GROUP BY`进行分组分析。 - 注意别名冲突和性能影响(避免在大型表上频繁调用)。 在复杂查询中,COUNT可与其他窗口函数结合,实现更高级的数据分析[^1]。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值