计算数据库中各个表的数据量和每行记录所占用空间

本文分享了一个SQL Server脚本,用于计算数据库中各表的数据量及每行记录占用的空间。通过实例展示了如何解决数据库查询慢等问题。

很多时候我们都需要计算数据库中各个表的数据量和每行记录所占用空间

这里共享一个脚本

CREATE TABLE #tablespaceinfo
    (
      nameinfo VARCHAR(500) ,
      rowsinfo BIGINT ,
      reserved VARCHAR(20) ,
      datainfo VARCHAR(20) ,
      index_size VARCHAR(20) ,
      unused VARCHAR(20)
    )  
 
DECLARE @tablename VARCHAR(255);  
 
DECLARE Info_cursor CURSOR
FOR
    SELECT  '[' + [name] + ']'
    FROM    sys.tables
    WHERE   type = 'U';  
 
OPEN Info_cursor  
FETCH NEXT FROM Info_cursor INTO @tablename  
 
WHILE @@FETCH_STATUS = 0
    BEGIN 
        INSERT  INTO #tablespaceinfo
                EXEC sp_spaceused @tablename  
        FETCH NEXT FROM Info_cursor  
    INTO @tablename  
    END 
 
CLOSE Info_cursor  
DEALLOCATE Info_cursor  
 
--创建临时表
CREATE TABLE [#tmptb]
    (
      TableName VARCHAR(50) ,
      DataInfo BIGINT ,
      RowsInfo BIGINT ,
      Spaceperrow AS ( CASE RowsInfo
                         WHEN 0 THEN 0
                         ELSE DataInfo / RowsInfo
                       END ) PERSISTED
    )

--插入数据到临时表
INSERT  INTO [#tmptb]
        ( [TableName] ,
          [DataInfo] ,
          [RowsInfo]
        )
        SELECT  [nameinfo] ,
                CAST(REPLACE([datainfo], 'KB', '') AS BIGINT) AS 'datainfo' ,
                [rowsinfo]
        FROM    #tablespaceinfo
        ORDER BY CAST(REPLACE(reserved, 'KB', '') AS INT) DESC  


--汇总记录
SELECT  [tbspinfo].* ,
        [tmptb].[Spaceperrow] AS '每行记录大概占用空间(KB)'
FROM    [#tablespaceinfo] AS tbspinfo ,
        [#tmptb] AS tmptb
WHERE   [tbspinfo].[nameinfo] = [tmptb].[TableName]
ORDER BY CAST(REPLACE([tbspinfo].[reserved], 'KB', '') AS INT) DESC  

DROP TABLE [#tablespaceinfo]
DROP TABLE [#tmptb]

注意:使用之前要计算哪个数据库的记录,请先USE一下要统计表记录数的那个数据库!!

 


工作中遇到的问题

可以说我在实际的工作中 ,在100个问题中有90个都会先用到这个脚本

这里举一个我本人工作中遇到的一些问题

 

问题一:

程序员反映数据库查询慢,5分钟还没有出结果

我先用这个脚本看一下这个表有多少记录,大概有1000w+条数据

然后在本地的SSMS里查询,确实也是大概4分钟的样子才出来数据,看一下执行计划,发现查询能使用到索引

看一下数据库的压力,并不是很大,我跟会不会跟数据量有关系呢?

程序员要查询的结果条数是500条数据,业务表是做了分区的,按道理应该不会慢成这样。。。

后来我再看一下共享出来的那个脚本的结果,发现查询的结果大小=每行记录的大小*记录数

要查询大概500MB的数据,再传到客户端,不慢才怪

 

为什麽查询出的结果这么大?

主要是有几个大字段:例如:二进制字段和NVARCHAR(MAX)

并且时间范围跨度比较大

 

马上叫程序员改一下查询的语句,由于是entity framework程序,怎麽改我就不太清楚了,主要是不必要的字段就不查询处理并且缩小时间范围

 

问题二:

还有一些问题也需要知道每行记录的大小,例如删除表的历史数据,QA说要保留2013年之前的数据,你需要查出保留的数据或者2013年之前的数据占用多少G空间

再结合当前服务器的磁盘可用空间,来评估删除的数据是否太多或者太少

那么流程是:先查出2013年之前的记录数有多少-》计算表的总记录数-》计算表的大小-》手工计算每行记录的大小-》乘以2013年之前的记录数

如果没有每行记录数这个字段,那么你手工计算,是不是效率就变慢了???

 

问题三:

导数据的时候,你想知道当前已经导了多少数据了,那么执行一下这个脚本就可以了,这个脚本基本不会被阻塞

很快就能查出结果


脚本的计算方法

方法一

实际上利用的就是数据行大小的信息除以记录数

CASE RowsInfo
WHEN 0 THEN 0
ELSE DataInfo / RowsInfo

 

 

 方法二

SELECT AVG(DATALENGTH(C0))+AVG(DATALENGTH(C1))+AVG(DATALENGTH(C2))+AVG(DATALENGTH(C3)) FROM [dbo].[TB106]

 

说一下两种方法的区别

第一种方法是效率高,当表有上亿条记录的时候,如果你使用第二种方法执行AVG(DATALENGTH(C0))是很慢的,因为SQLSERVER要统计字段大小信息

可能十几分钟都出不来结果

 

当然,第一种方法也有一些缺陷,就是当表的记录数少的时候,统计出来的每行记录占用空间是不准确的

因为datainfo这个值是以数据页大小为单位的,因为就算表只有一条记录,那么也会占用一个数据页(8KB)

那么当8KB/1 =8KB,一条记录肯定不会是8KB大小的,所以记录少的时候会不准确

但是当记录数很多的时候,就准确了

 

看一下TB106这个表统计出来的结果值

SELECT AVG(DATALENGTH(C0))+AVG(DATALENGTH(C1))+AVG(DATALENGTH(C2))+AVG(DATALENGTH(C3)) FROM [dbo].[TB106]

可以看到是比较准确的

 

注意:

无论方法一还是方法二都不包括索引所占用的空间 !!


总结

大家平时一定会想:究竟DBA有什么作用?

在这里就给大家一个例子了,在工作中,程序员是不会关心他要查询的数据的大小的,他不管三七二十一只要把数据select出来就行了,然后收工

DBA这里就要解决数据查询不出来的问题,一般的程序员觉得查询500条数据是很少的,根本不会关心表设计,表的字段的数据类型

当工作越来越多,开发任务越来越重的时候更是这样



 
所以本人觉得DBA这个角色还是比较重要的o(∩_∩)o 
 
如有不对的地方,欢迎大家拍砖o(∩_∩)o 
 
 
2014-7-7 脚本bug修复
由于算出来每行记录的精度有问题,我又对脚本的精度进行了改进
CREATE TABLE #tablespaceinfo
    (
      nameinfo VARCHAR(500) ,
      rowsinfo BIGINT ,
      reserved VARCHAR(20) ,
      datainfo VARCHAR(20) ,
      index_size VARCHAR(20) ,
      unused VARCHAR(20)
    )  
 
DECLARE @tablename VARCHAR(255);  
 
DECLARE Info_cursor CURSOR
FOR
    SELECT  '[' + [name] + ']'
    FROM    sys.tables
    WHERE   type = 'U';  
 
OPEN Info_cursor  
FETCH NEXT FROM Info_cursor INTO @tablename  
 
WHILE @@FETCH_STATUS = 0
    BEGIN 
        INSERT  INTO #tablespaceinfo
                EXEC sp_spaceused @tablename  
        FETCH NEXT FROM Info_cursor  
    INTO @tablename  
    END 
 
CLOSE Info_cursor  
DEALLOCATE Info_cursor  
 
--创建临时表
CREATE TABLE [#tmptb]
    (
      TableName VARCHAR(50) ,
      DataInfo BIGINT ,
      RowsInfo BIGINT ,
      Spaceperrow  AS ( CASE RowsInfo
                         WHEN 0 THEN 0
                         ELSE CAST(DataInfo AS decimal(18,2))/CAST(RowsInfo AS decimal(18,2))
                       END ) PERSISTED
    )

--插入数据到临时表
INSERT  INTO [#tmptb]
        ( [TableName] ,
          [DataInfo] ,
          [RowsInfo]
        )
        SELECT  [nameinfo] ,
                CAST(REPLACE([datainfo], 'KB', '') AS BIGINT) AS 'datainfo' ,
                [rowsinfo]
        FROM    #tablespaceinfo
        ORDER BY CAST(REPLACE(reserved, 'KB', '') AS INT) DESC  


--汇总记录
SELECT  [tbspinfo].* ,
        [tmptb].[Spaceperrow] AS '每行记录大概占用空间(KB)'
FROM    [#tablespaceinfo] AS tbspinfo ,
        [#tmptb] AS tmptb
WHERE   [tbspinfo].[nameinfo] = [tmptb].[TableName]
ORDER BY CAST(REPLACE([tbspinfo].[reserved], 'KB', '') AS INT) DESC  

DROP TABLE [#tablespaceinfo]
DROP TABLE [#tmptb]

 

转载于:https://www.cnblogs.com/yzwdli/p/5337881.html

<think>首先,用户的问题是关于MySQL的:他们想查询每个数据库记录数、数据容量、索引大小碎片占用情况。系统指令要求我使用中文回答,并遵循特定的格式,比如行内数学达式用$...$,独立公式用$$...$$。但在这个上下文中,数学达式可能不相关,因为这是一个数据库查询问题。 关键点: - 用户需求:查询每个数据库记录数量、数据容量、索引大小碎片占用情况。 - 系统指令:生成相关问题,回答结构清晰,参考站内引用。 回顾站内引用: - 引用[1]:讨论数据页主键值,但似乎不直接相关。 - 引用[2][3]:都提供了相同的SQL查询来获取数据库的容量、记录数等。 - 引用[4]:关于MySQL优化参数,如key_buffer_size等。 用户的问题直接引用[2][3]的内容:他们想运行一个查询来获取这些信息。引用[2][3]给出了相同的SQL语句: ```sql SELECT table_schema as '数据库', sum(table_rows) as '记录数', sum(truncate(data_length/1024/1024, 2)) as '数据容量(MB)', sum(truncate(index_length/1024/1024, 2)) as '索引容量(MB)', sum(truncate(DATA_FREE/1024/1024, 2)) as '碎片占用(MB)' FROM information_schema.tables GROUP BY table_schema ORDER BY sum(data_length) desc, sum(index_length) desc; ``` 所以,我应该将这个查询作为核心部分提供。 回答结构: - 清晰、逐步解释。 - 使用中文。 - 在末尾添加引用标识,如[^1]。 - 生成相关问题。 步骤: 1. **介绍问题**:解释如何查询MySQL中每个数据库的统计信息。 2. **提供查询**:给出SQL查询,并解释每个部分。 3. **解释查询**:简要说明information_schema.tables,以及各个字段的含义。 4. **注意事项**:提到可能的限制,比如table_rows可能不是完全准确,因为它是估计值。 5. **示例输出**:如果可能,提供一个示例输出,但不要虚构数据;可以描述一般格式。 6. **生成相关问题**:在最后添加相关问题。 由于系统指令要求“回答中引用的段落末尾自然地添加引用标识”,我需要引用提供的引用内容。用户问题中引用了[2][3],它们都包含相同的查询。所以,在提供查询时,我应该添加引用标识。 可能的引用点: - 当提供查询时,引用[2][3]。 - 引用[4]可能不直接相关,但可以提到优化参数。 用户的问题是基于引用[2][3]的,所以我主要参考它们。 最终回答结构: - 开头:直接回答问题。 - 主体:提供SQL查询,解释。 - 结尾:添加注意事项引用。 - 然后,添加相关问题。 相关问题生成: - 基于主题:MySQL数据库管理、优化等。 - 例如: 1. 如何优化MySQL数据库性能? 2. 什么是碎片,如何减少它? 3. 如何获取单个的统计信息? 4. MySQL中information_schema是什么? 5. 如何监控MySQL服务器资源使用? 确保问题相关。 数学达式:在这个回答中,可能不需要数学达式,除非涉及计算。但如果有,比如在解释truncate函数时,可以用行内格式,如$truncate(data_length/1024/1024, 2)$。 现在,草拟回答。</think>### MySQL 查询每个数据库记录数、数据容量、索引大小碎片占用情况 在 MySQL 中,要查询每个数据库记录数量、数据容量、索引大小碎片占用情况,可以通过查询 `information_schema.tables` 系统来实现。这个存储了所有数据库的元数据信息。以下是详细的步骤查询方法: #### 步骤 1: 使用标准 SQL 查询 运行以下 SQL 语句,它将汇总每个数据库的统计信息: ```sql SELECT table_schema AS '数据库', SUM(table_rows) AS '记录数', SUM(TRUNCATE(data_length / 1024 / 1024, 2)) AS '数据容量(MB)', SUM(TRUNCATE(index_length / 1024 / 1024, 2)) AS '索引容量(MB)', SUM(TRUNCATE(data_free / 1024 / 1024, 2)) AS '碎片占用(MB)' FROM information_schema.tables GROUP BY table_schema ORDER BY SUM(data_length) DESC, SUM(index_length) DESC; ``` #### 步骤 2: 查询解释 - **数据库 (`table_schema`)**:数据库名称。 - **记录数 (`table_rows`)**:记录的行数(注意:这是基于存储引擎的估计值,可能不是精确值,尤其在 InnoDB 中)。 - **数据容量 (`data_length`)**:数据存储空间大小(单位:字节),通过 `TRUNCATE(data_length / 1024 / 1024, 2)` 转换为 MB 并保留两位小数。 - **索引容量 (`index_length`)**:索引存储空间大小(单位:字节),同样转换为 MB。 - **碎片占用 (`data_free`)**:未使用的碎片空间(单位:字节),转换为 MB。碎片是数据库删除更新操作后留下的空闲空间,过多碎片会影响性能[^4]。 - **GROUP BY table_schema**:按数据库分组汇总。 - **ORDER BY**:按数据容量索引容量降序排序,便于优先查看大数据库。 #### 步骤 3: 注意事项 - **权限要求**:需要访问 `information_schema` 数据库的权限(通常管理员权限即可)。 - **准确性**:`table_rows` 是估计值,对于精确行数,建议使用 `SELECT COUNT(*)` 针对具体查询。碎片值 (`data_free`) 在高频写入/删除场景中可能较高,需定期优化(如运行 `OPTIMIZE TABLE`)。 - **单位转换**:查询中使用 `TRUNCATE(..., 2)` 确保结果以 MB 显示并保留两位小数。如果需要 GB 单位,可修改为 `TRUNCATE(... / 1024, 2)`。 - **性能影响**:此查询在大型数据库中可能较慢,建议在低峰期执行[^2][^3]。 #### 示例输出 执行查询后,结果类似下: | 数据库 | 记录数 | 数据容量(MB) | 索引容量(MB) | 碎片占用(MB) | |-------------|--------|--------------|--------------|--------------| | my_database | 10000 | 350.50 | 120.75 | 15.20 | | test_db | 5000 | 200.30 | 80.40 | 8.50 | 此方法基于 MySQL 系统统计,适用于大多数存储引擎(如 InnoDB、MyISAM)[^2][^3]。如果碎片占用过高,可参考优化参数如 `key_buffer_size` `innodb_buffer_pool_size` 来提升性能[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值