索引是对数据库表中一个或多个列

本文深入解析了数据库索引的工作原理及不同类型的索引,包括唯一索引、主键索引和聚集索引的特点与应用场景。介绍了如何根据数据访问模式选择合适的索引来优化查询性能。

可以利用索引快速访问数据库表中的特定信息。索引是对数据库表中一个或多个列(例如,employee   表的姓氏   (lname)   列)的值进行排序的结构。如果想按特定职员的姓来查找他或她,则与在表中搜索所有的行相比,索引有助于更快地获取信息。  
  索引提供指针以指向存储在表中指定列的数据值,然后根据指定的排序次序排列这些指针。数据库使用索引的方式与使用书的目录很相似:通过搜索索引找到特定的值,然后跟随指针到达包含该值的行。  
  在数据库关系图中,可以为选定的表创建、编辑或删除索引/键属性页中的每个索引类型。当保存附加在此索引上的表或包含此表的数据库关系图时,索引同时被保存。有关详细信息,请参见创建索引。  
  通常情况下,只有当经常查询索引列中的数据时,才需要在表上创建索引。索引将占用磁盘空间,并且降低添加、删除和更新行的速度。不过在多数情况下,索引所带来的数据检索速度的优势大大超过它的不足之处。然而,如果应用程序非常频繁地更新数据,或磁盘空间有限,那么最好限制索引的数量。  
   
  索引类型  
  根据数据库的功能,可在数据库设计器中创建三种类型的索引   —   唯一索引、主键索引和聚集索引。  
  提示       尽管唯一索引有助于找到信息,但为了获得最佳性能,建议使用主键约束或唯一约束。  
  唯一索引  
  唯一索引不允许两行具有相同的索引值。  
  主键索引  
  数据库表通常有一列或列组合,其值用来唯一标识表中的每一行。该列称为表的主键。  
  在数据库关系图中为表定义一个主键将自动创建主键索引,主键索引是唯一索引的特殊类型。主键索引要求主键中的每个值是唯一的。  
  聚集索引  
  聚集索引中,表中各行的物理顺序与键值的逻辑(索引)顺序相同。表只能包含一个聚集索引。  
  如果不是聚集索引,表中各行的物理顺序与键值的逻辑顺序不匹配。聚集索引比非聚集索引有更快的数据访问速度  
  在   Microsoft?   SQL   Server?   数据库中可以创建聚集索引。在聚集索引中,表中各行的物理顺序与索引键值的逻辑(索引)顺序相同。表只能包含一个聚集索引。聚集索引通常可加快   UPDATE   和   DELETE   操作的速度,因为这两个操作需要读取大量的数据。创建或修改聚集索引可能要花很长时间,因为执行这两个操作时要在磁盘上对表的行进行重组。  
  可考虑将聚集索引用于:    
  1:包含数量有限的唯一值的列,如   state   列只包含   50   个唯一的州代码。  
  2:使用下列运算符返回一个范围值的查询:BETWEEN、>、>=、<   和   <=。  
  3:返回大结果集的查询。   (摘自Microsoft?   SQL   Server?帮助)  
  聚集索引对于那些经常要搜索范围值的列特别有效。使用聚集索引找到包含第一个值的行后,便可以确保包含后续索引值的行在物理相邻。例如,如果应用程序执行的一个查询经常检索某一日期范围内的记录,则使用聚集索引可以迅速找到包含开始日期的行,然后检索表中所有相邻的行,直到到达结束日期。这样有助于提高此类查询的性能。同样,如果对从表中检索的数据进行排序时经常要用到某一列,则可以将该表在该列上聚集(物理排序),避免每次查询该列时都进行排序,从而节省成本。  
  当索引值唯一时,使用聚集索引查找特定的行也很有效率。例如,使用唯一雇员   ID   列   emp_id   查找特定雇员的最快速的方法,是在   emp_id   列上创建聚集索引或   PRIMARY   KEY   约束。  
  在创建聚集索引之前,应先了解您的数据是如何被访问的。可考虑将聚集索引用于:    
  1   包含大量非重复值的列。  
  2   使用下列运算符返回一个范围值的查询:BETWEEN、>、>=、<   和   <=。  
  3   被连续访问的列。  
  4   返回大型结果集的查询。  
  5   经常被使用联接或   GROUP   BY   子句的查询访问的列;一般来说,这些是外键列。对   ORDER   BY   或   GROUP   BY   子句中指定的列进行索引,可以使   SQL   Server   不必对数据进行排序,因为这些行已经排序。这样可以提高查询性能。  
  6   OLTP   类型的应用程序,这些程序要求进行非常快速的单行查找(一般通过主键)。应在主键上创建聚集索引。    
  聚集索引不适用于:    
  1   频繁更改的列   这将导致整行移动(因为   SQL   Server   必须按物理顺序保留行中的数据值)。这一点要特别注意,因为在大数据量事务处理系统中数据是易失的。  
  2   宽键     来自聚集索引的键值由所有非聚集索引作为查找键使用,因此存储在每个非聚集索引的叶条目内。  
  说明  
  如果该表上尚未创建聚集索引,且在创建   PRIMARY   KEY   约束时未指定非聚集索引,PRIMARY   KEY   约束会自动创建聚集索引。  
  注意事项  
  定义聚集索引键时使用的列越少越好,这一点很重要。如果定义了一个大型的聚集索引键,则同一个表上定义的任何非聚集索引都将增大许多,因为非聚集索引条目包含聚集键。当把   SQL   脚本保存到可用空间不足的磁盘上时,索引优化向导不返回错误。

 

本文来自优快云博客,转载请标明出处:http://blog.youkuaiyun.com/dianfeng21sj/archive/2007/05/20/1618469.aspx

<think>根据用户问题“我想了解数据库一个page的大小”,结合提供的引用资料,InnoDB存储引擎的默认页大小是16KB。引用[2]明确指出默认innodb_page_size为16KB(16384字节),引用[4]的查询结果也显示innodb_page_size=16384。引用[1]详细出了页内各组成部分的占用空间,总可用空间约为16252字节(16KB减去132字节的固定开销)。引用[3]提到历史版本曾使用8KB,但5.6后默认改为16KB。 回答需强调三点:默认值16KB、历史版本差异、空间组成。同时按系统指令生成相关问题。 用户问题是明确询问具体数值,因此直接给出16KB的结论,并解释空间分配。历史版本信息作为补充说明。 </think>### 数据库中页(Page)的大小 在数据库存储引擎中,**页(Page)** 是数据存储磁盘I/O操作的基本单位。根据提供的引用信息,结论如下: 1. **默认页大小** MySQL的InnoDB存储引擎默认页大小为 **16KB**(即 $16 \times 1024 = 16384$ 字节)[^2][^4]。 通过以下命令可验证: ```sql SHOW GLOBAL VARIABLES LIKE 'innodb_page_size'; -- 返回值为16384 ``` 2. **页的空间组成** 一个16KB页的实际可用空间约为 **16252字节**,剩余空间被必要元数据占用[^1]: $$ \begin{align*} \text{总空间} &= 16384\text{字节} \\ \text{元数据占用} &= \underbrace{38}_{\text{File Header}} + \underbrace{56}_{\text{Page Header}} + \underbrace{26}_{\text{虚拟记录}} + \underbrace{4}_{\text{Page Directory}} + \underbrace{8}_{\text{File Trailer}} = 132\text{字节} \\ \text{可用空间} &= 16384 - 132 = 16252\text{字节} \end{align*} $$ 这部分空间用于存储实际数据(如行记录、索引等)。 3. **历史版本差异** 在MySQL 5.6之前的版本中,默认页大小为 **8KB**(8192字节)[^2]。升级到5.6及更高版本后,默认值改为16KB。 4. **自定义页大小** 虽然MySQL官方未提供直接修改页大小的参数,但可通过修改源码重新编译实现(如调整为8KB其他值)[^3]。需注意: - 修改可能影响性能(如更小的页适合OLTP场景,减少I/O;更大的页利于扫描操作)。 - 需重新初始化数据库,且与默认页大小不兼容。 --- ### 相关问题 1. 如何计算InnoDB页中行记录的实际存储空间? 2. 修改`innodb_page_size`会对数据库性能产生哪些具体影响? 3. 为什么InnoDB选择16KB作为默认页大小?其设计依据是什么? 4. 页大小与操作系统文件系统块大小的关系如何影响I/O效率?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值