一、为什么要分区?
需求:大数据。解决方案:分而治之,更细一点即为。将大表和大索引分为一个更小的操作单元在 mysql 中,分区允许将表、索引和索引编排表细分为更小的单元。分区后,每个分区有自己单独的名称。对于DBA来讲,这些分区可以统一管理,也可以分开管理。
但是对于应用程序来讲,分区的表和没有分区的表示一样的。换句话来讲,分区对于应用是透明的,只是 数据库 对于数据的重新整理。
Mysql分区,这个是mysql对于分区的官方解释。
1.分区的作用
a)提升性能应该说,几乎所有分区的目的都是用来提升性能的。不是谁哪天早上吃着鸡蛋灌饼,说咱们分个区玩玩吧!不是的。那么分区是如何来提升检索数据的性能的呢?没有分区之前,数据每次在查询和检索总是面向的是整个数据库和表。分区之后,mysql针对每个分区生成特定的数据文件与索引文件。每次只会检索特定的部分数据,因此可以更好的来执行和维护数据库。究其原因还是因为在分区之后表指派到不同的物理驱动器上,这样便可在同时访问多个分区时减少物理 I/O 争用。
b)易于管理
对于一些无用的冗余的历史数据来讲,可以根据分区之后直接删除相应的分区。操作起来更加简便,因为执行数以万计的数据远比直接删除文件来的困难的多、时间也更加的长。
c)容错
分区之后相比分区之前,一张表从之前一个文件分为现在的三个文件。分区之后即使一个文件出现破坏,也不会影响其他数据。
2..常用分区方法
RANGE分区
LIST分区
HASH分区
KEY分区
二、如何分区?
1.查看数据库是否支持分区
1
|
SHOW VARIABLES
LIKE
'%partition%'
;
|
对于mysql来讲,现阶段支持分区操作的版本有5.1和5.5.如图显示为YES则表明该数据库支持分区操作。
2.四种常见分区
Range分区
俗称:范围分区。根据表的字段的值,依据给定某段连续的区间来分区。
直接创建表时分区
1
2
3
4
5
6
7
8
9
10
11
12
13
|
create
table
teacher
(id
varchar
(20)
not
null
,
name
varchar
(20),
age
varchar
(20),
birthdate
date
not
null
,
salary
int
)
partition
by
range(
year
(birthdate))
(
partition p1
values
less than (1970),
partition p2
values
less than (1990),
partition p3
values
less than maxvalue
);
|
Ps:创建teacher表,并在创建teacher表同时根据birthdate字段将表划分为p1、p2、p3三个分区。
在创建表后分区
1
2
3
4
5
6
7
|
ALTER
TABLE
teacher
partition
by
range(
year
(birthdate))
(
partition p1
values
less than (1970),
partition p2
values
less than (1990),
partition p3
values
less than maxvalue
);
|
Ps:给已经创建了的表分区,分为p1、p2、p3.
LIST分区
俗名:列表分区。其实list分区和range分区应该说都是一样的,不同的是range分区在分区是的依据是一段连续的区间;而list分区针对的分区依据是一组分布的散列值。
1
2
3
4
5
6
7
8
9
10
11
12
|
create
table
student
(id
varchar
(20)
not
null
,
studentno
int
(20)
not
null
,
name
varchar
(20),
age
varchar
(20)
)
partition
by
list(studentno)
(
partition p1
values
in
(1,2,3,4),
partition p2
values
in
(5,6,7,8),
partition p3
values
in
(9,10,11)
);
|
Ps:如上创建表student,并将student表分为p1、p2、p3三个分区。需要注意的是一般情况下,针对表的分区字段为int等数值类型。
HASH分区
小名:哈希分区。哈希分区主要是依据表的某个字段以及指定分区的数量。
1
2
3
4
5
6
7
|
create
table
user
(
id
int
(20)
not
null
,
role
varchar
(20)
not
null
,
description
varchar
(50)
)
partition
by
hash(id)
partitions 10;
|
Ps:如上创建user表,并将user表平均分为十个分区。比较有限制的就是需要知道表的数据有多少才能更好平均分配分区。
key分区
类似于按HASH分区,区别在于KEY分区只支持计算一列或多列,且MySQL服务器提供其自身的哈希函数。必须有一列或多列包含整数值。
1
2
3
|
create
table
role( id
int
(20)
not
null
,
name
varchar
(20)
not
null
)
partition
by
linear
key
(id)
partitions 10;
|
3.分区表管理
对指定表添加分区
1
|
alter
table
user
add
partition(partition p4
values
less than MAXVALUE);
|
删除指定表指定分区
alter table student drop partition p1;
创建子分区
1
2
3
4
5
6
7
8
|
create
table
role_subp(id
int
(20)
not
null
,
name
int
(20)
not
null
)
partition
by
list(id)
subpartition
by
hash(
name
)
subpartitions 3
(
partition p1
values
in
(10),
partition p2
values
in
(20)
)
|
复合分区
1
2
3
|
alter
table
user
reorganize partition p1,p3
into
(partition p1
values
less than (1000));
|