很多人会把
Primary Key和聚集索引搞混起来,或者认为这是同一个东西。这个概念是非常错误的。
主键是一个约束(constraint),他依附在一个索引上,这个索引可以是聚集索引,也可以是非聚集索引。
所以在一个(或一组)字段上有主键,只能说明他上面有个索引,但不一定就是聚集索引。
例如下面:
USE [pratice]
GO
CREATE TABLE #tempPKCL
(
ID INT PRIMARY KEY CLUSTERED --聚集索引
)
---------------------------------
USE [pratice]
GO
CREATE TABLE #tempPKNCL
(
ID INT PRIMARY KEY NONCLUSTERED --非聚集索引
)
DROP TABLE [#tempPKCL]
DROP TABLE [#tempPKNCL]
如果不加NONCLUSTERED和CLUSTERED关键字,默认建的是聚集索引
而一个聚集索引里,是可以有重复值的。只要他没有被同时设为主键,但是主键不能有重复值(不管依附在聚集索引上还是非聚集索引上)
强调这一点,是因为有些人觉得自己的表格上设置了主键,就认为表格上有聚集索引,按照B-树的方式管理了。
如果没有指定主键是个聚集索引,可能表格还是会以堆的方式管理,效率低下
关于排序和重复值:
排序:建立复合索引的时候会指定多个字段,那么这个索引顺序是按哪个字段顺序排序呢?
是按照索引上的第一个字段排序
下面这个索引的排序顺序是以ID这个字段排序的
CREATE INDEX tempPKNCL_id_ncl ON [dbo].[tempPKNCL]([ID],[a],[c])
重复值:如果对多列定义了 PRIMARY KEY 约束,则一列中的值可能会重复,但来自 PRIMARY KEY 约束定义中所有列的任何值组合必须唯一。
如下图所示,Purchasing.ProductVendor 表中的 ProductID 和 VendorID 列构成了针对此表的复合 PRIMARY KEY 约束。
这确保了 ProductID 和 VendorID 的组合是唯一的

意思是说,如果是复合主键,那么如果ProductID列有重复,但是 ProductID 和 VendorID 的组合是唯一的
言下之意:
(1)主键不是复合主键
(2)主键建立在ProductID字段上
(3)ProductID字段有重复值
那么主键建立肯定会失败
【SqlServer】聚集索引与主键、非聚集索引 解析
聚集索引、非聚集索引在SqlServer、MySQL、Oracle...等数据库中都有这个概念,只不过在SqlServer中叫做聚集索引和非聚集索引而已。下面笔者将会以SqlServer数据库来讲解。
1.聚集索引和非聚集索引的区别
聚集索引:该索引中键值的逻辑顺序决定了表中相应行的物理顺序。
非聚集索引:该索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。
索引是通过二叉树的数据结构来描述的,我们可以这么理解聚集索引:索引的叶子节点就是数据节点。而非聚集索引的叶节点仍然是索引节点,只不过有一个指针指向真正数据所在的数据块。
看下图
聚集索引:

通过这张图片可以看出,数据库的数据是按照某一顺序排列好的,而叶子节点就是真实的数据节点。
非聚集索引:

通过这张非聚集索引的图片,我们也可以看出,叶子节点也是数据节点,只不过该节点并非真实的数据节点,该节点存储的是真实数据的内存地址。
下面是一张何时使用聚集索引和非聚集索引的表:

通过上面的图,相信对聚集索引和非聚集索引有了一定的概念了。接来下举个实例,假如有一张500万条数据的消息表,id是主键(13位随机数),time是数据的添加日期,现在需要查询2两年内的所有数据,这很显而易见应该给time添加聚集索引,因为查询的条件为 where time 。所以应该给time添加添加聚集索引,如果是这样的情况,笔者建议最好再给表添加一个idate字段,idate存储当前时间的毫秒数,字段的类型不建议为varchar,最好为int,若int装不下可以设置为numeric,因为int的查询效率要比varchar的效率高。
2.聚集索引和主键的区别
笔者在网上看见有人提出,主键就是加了唯一性约束的聚集索引,这句话不全对。
主键的定义:“主键指的是一个列或多列的组合,其值能唯一地标识表中的每一行,通过它可强制表的实体完整性。”
在SqlServer中,创建主键的列,默认添加一个聚集索引。主键不仅可以关联聚集索引,还可以关联非聚集索引。因此只能说主键和索引有关系。
但是需要明白,主键和索引的作用是不一样的,主键的作用是为了唯一标识表中的某一行,而索引的作用是为了提高查询效率。SqlServer默认给主键列添加聚集索引,这在某些情况下就显得比较浪费,在实际情况中,我们一般都会给ID设置为主键,如果ID是随机产生的,那么这个时候给ID再设置上聚集索引就有点浪费了,原因有二,第一,一般情况不会再按照ID查询区间值数据了,第二,一个表中只能有一个聚集索引,所以聚集索引比较珍贵,要尽可能的发挥聚集索引的最大作用。
3.主键, 聚集索引, 和 非聚集索引 的常规操作
-- 创建聚集索引
create clustered index inx_entry_stock_bi on entry_stock_d(entry_stock_bi)
-- 创建非聚集索引
create nonclustered index inx_entry_stock on entry_stock_d(entry_stock_bi)
-- 索引包含列
create nonclustered index inx_entry_stock on entry_stock_d(entry_stock_bi)
include(column1, column2,...)
-- 创建 主键非聚集索引
alter table entry_stock_d add primary key nonclustered--主键且非聚集
(
entry_stock_bi,aid
)
-- 创建 主键, 聚集索引 和 自增长
create table entry_stock_d(
aid int primary key clustered IDENTITY(1,1),
entry_stock_bi varchar(10)
);
-- 撤销主键或索引
alter table table_name drop constraint name
4. 建立索引的一般原则
- 每个表中只能创建一个聚集索引。
- 定义
text,image,bit数据类型的列上不要建立索引。 - 在经常查询的字段上建立索引。
- 在主键列上一定要建立索引。
- 在那些重复的值比较多,查询较少的列上不要建立索引。
- 要
Select的字段,可以考虑在Where字段的索引上,添加包含列。 - 默认情况下,如果未指定聚集,将创建非聚集索引。 对于每个表可创建的最大非聚集索引数为
999。 这包括使用PRIMARY KEY或UNIQUE约束创建的任何索引,但不包括XML索引。
主键是表的唯一标识,可以关联聚集或非聚集索引。聚集索引中键值决定数据物理顺序,而非聚集索引则独立于数据。默认主键创建为聚集索引,但非聚集索引更节省空间。创建索引应考虑查询需求和数据重复性,避免在重复值多或非查询字段上建立。合理使用索引能显著提升查询效率。
92

被折叠的 条评论
为什么被折叠?



