分区的概念
数据分区:
mysql 数据库中的数据是以文件的形式存储在磁盘上,默认放在/mysql/data下面
show variables like 'datadir'; 查看数据物理存储位置
一张表主要对应三个文件,1)frm存放表结构,2)myd存放表数据,3)myi存放表索引。
如果一张表的数据量太大,则myd,myi会变的很大,查找数据就会边的很慢
此时可以利用mysql的分区功能,在物理上将这张表对应的三个文件,分割成很多小块,此时查找一条数据时,就不用全部扫描查找了,
只要知道这条数据在那一块,然后在那一块查找,如果表数据太大,可能一个磁盘放不下,则可以将数据分配到不同的磁盘里面
分区适用于一个表的所有数据和索引;不能只对数据分区而不对索引分区,反之亦然,同时也不能只对表的一部分进行分区。
表分区
1、什么是表分区
根据一定规则,将数据库中的一张表分解成多个更小的,便于管理。逻辑上,只有一张表,但底层却是由多个物理分区组成。
2、表分区和分表
分表:指通过一定规则,将一张表分解成多张不同的表。例如将用户表,根据注册时间分成多个表。
分表与分区的区别在于:分区从逻辑上只有一张表,分表是将一张表分成多张表。
3、表分区作用:
1)数据可以分布到不同的物理设备上,从而高效地利用多个硬件设备。
2)跟单个磁盘或者文件系统相比,可以存储更多数据
3)优化查询
在where 条件语句中包含分区条件时,可以只扫描一个或多个分区表来提高查询效率
涉及sum和count等函数语句时,也可以在多个分区上并行处理,最后汇总结果。
4)容易维护
例如:批量操作时,删除大量数据,则可以清楚整个分区
5)使用分区表来避免某些特殊的瓶颈
eg:innoDB单个索引的互斥访问
4、限制因素:
1)一个表最多只能有1024个分区
2)mysql 5.1 分区表达式必须是整数,或者返回整数的表达式。在mysql 5.5中提供了非整数表达式分区的支持。
3)如果分区字段中有主键或者唯一索引,则主键列和唯一索引列都必须包含进来或者都不包含。
4)分区表中不支持使用外键约束
5)分区适用于一个表的所有数据和索引,不能只对表的一部分数据分区
分区类型
RANGE 分区:基于属于一个给定连续区间的列值,把多行分配给分区。
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT NOT NULL,
store_id INT NOT NULL
)
PARTITION BY RANGE (store_id) (
PARTITION p0 VALUES LESS THAN (6),
PARTITION p1 VALUES LESS THAN (11),
PARTITION p2 VALUES LESS THAN (16),
PARTITION p3 VALUES LESS THAN MAXVALUE
);
LIST 分区:类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择。
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT,
store_id INT
)
PARTITION BY LIST(store_id)(
PARTITION pNorth VALUES IN (3,5,6,9,17),
PARTITION pEast VALUES IN (1,2,10,11,19,20),
PARTITION pWest VALUES IN (4,12,13,14,18),
PARTITION pCentral VALUES IN (7,8,15,16)
);
HASH分区:基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算。这个函数可以包含MySQL 中有效的、产生非负整数值的任何表达式。
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT,
store_id INT
)
PARTITION BY HASH(store_id)
PARTITIONS 4;
KEY 分区:类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL 服务器提供其自身的哈希函数。必须有一列或多列包含整数值。
CREATE TABLE tk (
col1 INT NOT NULL,
col2 CHAR(5),
col3 DATE
)
PARTITION BY LINEAR KEY (col1)
PARTITIONS 3;