SQL Server-聚焦ROW_NUMBER VS TOP N性能

TOPN与ROW_NUMBER性能对比

最新推荐文章于 2024-10-26 13:00:00 发布

转载最新推荐文章于 2024-10-26 13:00:00 发布 · 137 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：https://yq.aliyun.com/articles/366814

本文通过实验对比了SQL Server中使用TOPN与ROW_NUMBER进行前N行数据查询的性能差异，发现虽然两种方法在小规模数据上的性能相近，但在大规模数据查询时，TOPN的性能更优。

前言

抱歉各位，从八月份开始一直在着手写EntityFramework 6.x和EntityFramework Core 2.0的书籍写作，所以最近一直遗漏了对博客的管理，后面会着手于写SQL Server、EntityFramework Core和.NET Core方面的博客。我们知道如果需要查询前N行数据，除了可以利用TOP N进行查询外，同样也可以利用ROW_NUMBER来达到同样的效果，那么二者使用哪个性能会更好呢？下面我们来比较下。

ROW_NUMBER VS TOP N

我们利用AdventureWorks2012示例库中的Production.Product表来进行演示，如下：

DBCC DROPCLEANBUFFERS()
DBCC FREEPROCCACHE()
GO

--ROW_NUMBER QUERY
SELECT ProductID
FROM (
    SELECT ProductID, ROW_NUMBER() OVER (ORDER BY ProductID) AS RN
    FROM Production.Product
    ) AS T
WHERE T.RN <= 100
GO

-- TOP N QUERY
SELECT 
    TOP 100 ProductID
FROM Production.Product
ORDER BY ProductID
GO

如上图所知，对于这两个查询计划的成本是一样的，都为50%。如果我们要检查在两个聚集索引扫描操作符中读取的估计行数，那么我们会注意到两者都显示相同的值，即100。可以说聚集索引扫描的估计和实际行数是相同的都是100，如下。

是不是就以此说明二者性能是一样的呢？稍等片刻，接下来我们将查询基数再设置大一点看看，比如1000而不再是100，如下：

DBCC DROPCLEANBUFFERS()
DBCC FREEPROCCACHE()
GO
SET STATISTICS IO ON
SET STATISTICS TIME ON
--ROW_NUMBER QUERY
SELECT ProductID
FROM (
    SELECT ProductID, ROW_NUMBER() OVER (ORDER BY ProductID) AS RN
    FROM Production.Product
    ) AS T
WHERE T.RN <= 1000
GO

-- TOP N QUERY
SELECT 
    TOP 1000 ProductID
FROM Production.Product
ORDER BY ProductID
GO