MySql 表的主键索引问题

本文介绍了如何使用索引来优化SQL查询,包括索引的工作原理、创建和删除索引的方法。通过实例说明了索引如何提高查询效率,尤其是在多表查询中。

查看某个表的建表语句 :show create table data_statdata;

drop index ts on data_statdata;

索引是加速查询的主要手段,特别对于涉及多个表的查询更是如此。本节中,将介绍索引的作用、特点,以及创建和删除索引的语法。

13.4.1 使用索引优化查询

索引是快速定位数据的技术,首先通过一个示例来了解其含义及作用,详细的介绍请参考第14章。

1.索引示例

假设对于10.3节所建的表,各个表上都没有索引,数据的排列也没有规律,如表13.3所示。

表13.3                                                     没有索引的students表

sid

sname

sgender

sage

52

zhang

M

21

22

wang

M

22

33

li

F

19

41

zhao

M

20

...

...

...

 

 

当查找某个学生信息时,必须顺序查看表students中的每一行,检查是否与所需值匹配,这需要扫描全表,效率很低。

表13.4给出了在name列上增加了索引的students表。

表13.4                                        在name列上增加了索引的students表

 

索引是在name上排序的。现在,当查找某个学生信息时,就不需要逐行搜索全表,可以利用索引进行有序查找(如二分查找法),并快速定位到匹配的值,以节省大量搜索时间。

2.索引作用

在索引列上,除了上面提到的有序查找之外,数据库利用各种各样的快速定位技术,能够大大提高查询效率。特别是当数据量非常大,查询涉及多个表时,使用索引往往能使查询速度加快成千上万倍。

例如,有3个未索引的表t1、t2、t3,分别只包含列c1、c2、c3,每个表分别含有1000行数据组成,指为1~1000的数值,查找对应值相等行的查询如下所示。

 

SELECT c1,c2,c3 FROM t1,t2,t3 WHERE c1=c2 AND c1=c3

此查询结果应该为1000行,每行包含3个相等的值。在无索引的情况下处理此查询,必须寻找3个表所有的组合,以便得出与WHERE子句相配的那些行。而可能的组合数目为1000×1000×1000(十亿),显然查询将会非常慢。

如果对每个表进行索引,就能极大地加速查询进程。利用索引的查询处理如下。

(1)从表t1中选择第一行,查看此行所包含的数据。

(2)使用表t2上的索引,直接定位t2中与t1的值匹配的行。类似,利用表t3上的索引,直接定位t3中与来自t1的值匹配的行。

(3)扫描表t1的下一行并重复前面的过程,直到遍历t1中所有的行。

在此情形下,仍然对表t1执行了一个完全扫描,但能够在表t2和t3上进行索引查找直接取出这些表中的行,比未用索引时要快一百万倍。

利用索引,MySQL加速了WHERE子句满足条件行的搜索,而在多表连接查询时,在执行连接时加快了与其他表中的行匹配的速度。

13.4.2 创建索引

在执行CREATE TABLE语句时可以创建索引,也可以单独用CREATE INDEX或ALTER TABLE来为表增加索引。

1.ALTER TABLE

ALTER TABLE用来创建普通索引、UNIQUE索引或PRIMARY KEY索引。

 

ALTER TABLE table_name ADD INDEX index_name (column_list)

ALTER TABLE table_name ADD UNIQUE (column_list)

ALTER TABLE table_name ADD PRIMARY KEY (column_list)

 

其中table_name是要增加索引的表名,column_list指出对哪些列进行索引,多列时各列之间用逗号分隔。索引名index_name可选,缺省时,MySQL将根据第一个索引列赋一个名称。另外,ALTER TABLE允许在单个语句中更改多个表,因此可以在同时创建多个索引。

2.CREATE INDEX

CREATE INDEX可对表增加普通索引或UNIQUE索引。

 

CREATE INDEX index_name ON table_name (column_list)

CREATE UNIQUE INDEX index_name ON table_name (column_list)

 

table_name、index_name和column_list具有与ALTER TABLE语句中相同的含义,索引名不可选。另外,不能用CREATE INDEX语句创建PRIMARY KEY索引。

3.索引类型

在创建索引时,可以规定索引能否包含重复值。如果不包含,则索引应该创建为PRIMARY KEY或UNIQUE索引。对于单列惟一性索引,这保证单列不包含重复的值。对于多列惟一性索引,保证多个值的组合不重复。

PRIMARY KEY索引和UNIQUE索引非常类似。事实上,PRIMARY KEY索引仅是一个具有名称PRIMARY的UNIQUE索引。这表示一个表只能包含一个PRIMARY KEY,因为一个表中不可能具有两个同名的索引。

下面的SQL语句对students表在sid上添加PRIMARY KEY索引。

 

ALTER TABLE students ADD PRIMARY KEY (sid)

 

13.4.3 删除索引

可利用ALTER TABLE或DROP INDEX语句来删除索引。类似于CREATE INDEX语句,DROP INDEX可以在ALTER TABLE内部作为一条语句处理,语法如下。

 

DROP INDEX index_name ON talbe_name

ALTER TABLE table_name DROP INDEX index_name

ALTER TABLE table_name DROP PRIMARY KEY

 

其中,前两条语句是等价的,删除掉table_name中的索引index_name。

第3条语句只在删除PRIMARY KEY索引时使用,因为一个表只可能有一个PRIMARY KEY索引,因此不需要指定索引名。如果没有创建PRIMARY KEY索引,但表具有一个或多个UNIQUE索引,则MySQL将删除第一个UNIQUE索引。

如果从表中删除了某列,则索引会受到影响。对于多列组合的索引,如果删除其中的某列,则该列也会从索引中删除。如果删除组成索引的所有列,则整个索引将被删除

<think>嗯,用户想了解MySQL主键索引和非主键索引的区别。我之前学过一些数据库的知识,但需要仔细回忆和整理。首先,主键索引应该和的物理存储有关,我记得InnoDB的主键索引是聚簇索引,数据直接存在叶子节点里。而非主键索引,也就是二级索引,它们的叶子节点存储的是主键的值。这样的话,当使用非主键索引查询时,可能需要回,也就是通过主键再去主键索引里找数据,这样会增IO操作,影响性能。 然后,主键索引还有唯一性和非空的约束,每个只能有一个主键索引。而非主键索引可以有多个,比如普通索引、唯一索引、联合索引等。它们的结构可能也不同,比如MyISAM引擎的主键索引和InnoDB的不同,但用户的问题可能集中在InnoDB上,因为这是常用的引擎。 还需要考虑存储内容的不同。主键索引的叶子节点存的是整行数据,而非主键索引存的是主键的值。这样在查询的时候,如果查询的列都包含在非主键索引中,可能不需要回,这叫做覆盖索引。比如,如果有一个索引是(c,a),而查询的字段正好是c和a,那么可以直接从索引中获取数据,不需要回。 另外,索引的维护成本也是一个区别。主键索引因为涉及数据的物理顺序,插入或删除数据时可能会引起页分裂或合并,影响性能。而非主键索引的更新可能更轻量,但如果有多个二级索引,更新操作也会影响这些索引,导致写操作变慢。 联合索引的情况也要注意,比如在引用[5]中的例子,索引是(a,b),那么查询条件只有a的时候可以用到索引,但单独用b的话不行。这可能涉及到最左前缀原则。此外,主键如果是联合主键的话,非主键索引的叶子节点存储的是联合主键的所有字段值,这样在回的时候需要根据所有主键字段去查找。 还有,主键索引通常会被用作其他索引的指针,比如外键关联的时候,可能会依赖主键索引。而非主键索引不会有这样的约束。 总结下来,主键索引和非主键索引要区别在于存储内容、是否聚簇、唯一性约束、查询是否需要回以及维护成本等方面。需要把这些点有条理地整理出来,用用户能理解的语言解释,同时结合引用中的例子,比如覆盖索引和联合索引的情况,来具体说明区别。</think>### MySQL主键索引与非主键索引区别分析 #### 1. **存储结构与数据定位** - **主键索引(聚簇索引)**: 叶子节点直接存储整行数据,数据行的物理存储顺序与索引顺序一致[^3]。例如`geek`的主键索引`(a,b)`会按`a,b`的值排序存储整行数据。 $$ \text{主键索引结构} \rightarrow [ (a,b) : (a,b,c,d) ] $$ - **非主键索引(二级索引)**: 叶子节点存储主键的值(若主键是联合主键,则存储所有主键字段的值),通过主键值回查询完整数据。例如索引`c`的叶子节点存储`c`的值和对应的主键`(a,b)`。 #### 2. **查询性能差异** - **主键索引**: 通过主键查询时可直接获取数据,时间复杂度为$O(\log n)$。 ```sql SELECT * FROM geek WHERE a=1 AND b=2; -- 直接命中主键索引 ``` - **非主键索引**: 需先通过二级索引找到主键值,再回查询主键索引获取数据(两次索引查找)。例如: ```sql SELECT * FROM geek WHERE c=3; -- 先查c索引得(a,b),再查主键索引 ``` #### 3. **覆盖索引优化** 若查询字段全部包含在二级索引中,可避免回操作。例如索引`ca(c,a)`: ```sql SELECT c, a FROM geek WHERE c=3; -- 直接从ca索引获取数据,无需回 ``` #### 4. **唯一性与约束** - 主键索引强制唯一且非空,每个仅有一个[^4]。 - 非主键索引允许重复值和空值,且一个可创多个(如普通索引、唯一索引)。 #### 5. **索引维护代价** - 主键索引的更新可能引发数据页分裂或合并(影响物理存储顺序)。 - 非主键索引的更新仅需调整索引树,但多个二级索引会放大写操作成本。 #### 6. **联合索引的最左前缀原则** 以联合索引`cb(c,b)`为例: ```sql WHERE c=3 AND b=2 -- 可使用索引 WHERE b=2 -- 无法使用索引(违反最左前缀) ``` #### 7. **引擎差异(InnoDB vs MyISAM)** - **InnoDB**:主键索引为聚簇索引,非主键索引依赖主键值回。 - **MyISAM**:主键索引和非主键索引均为非聚簇索引,数据与索引分离存储[^1]。 --- ### 总结对比 | 特性 | 主键索引 | 非主键索引 | |---------------------|-------------------------|-------------------------| | 存储内容 | 整行数据 | 主键值 | | 是否聚簇 | 是(InnoDB) | 否 | | 唯一性 | 强制唯一 | 可重复 | | 查询性能 | 直接定位数据 | 可能需回 | | 索引数量 | 每个仅一个 | 可多个 | | 外键关联 | 支持 | 不支持 | ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值