MySQL分区表

MySQL分区详解

  1.分区算法

MySQL提供4种分区算法:取余:Keyhash  条件:Listrange 。

参与分区的参数字段需要为主键的一部分。

(1KEY – 取余 ,按照某个字段进行取余

 

 分成5个区,就是对5取余。将id5取余。

(2Hash – 取余,按照某个表达式的值进行取余

示例:学生表分区,按照生日的月份,划分到12个表中。 

 

注意:Keyhash都是取余算法,要求分区参数(括号里的),返回的数据必须为整数。

(3List – 条件 – 列表,需要指定的每个分区数据的存储条件。

示例:按照生日中的月份,分成春夏秋冬四个分区。

 

 

List,条件依赖的数据是列表形式。

(4Range - 条件范围, 条件依赖的数据是一个条件表达式。

逻辑:按照生日的年份分成不同的年龄段。

 

  

2.分区的管理与选择

(1)取余:key,hash

增加分区数量: add partition partitions  N 

 

减少分区数量: COALESCE partition N

 

采用取余算法的分区数量的修改,不会导致已有分区数据的丢失,因为会重新分配数据到新的分区。

(2)条件:list,range

添加分区

 

删除分区:

Drop partition partition_name;

 

 注意:删除条件算法的分区,会导致分区数据丢失。添加分区不会。

(3)选择分区算法

平均分配:就按照主键进行key(primary key)即可(非常常见)

按照某种业务逻辑分区:选择那种最容易被筛选的字段,整数型

3.分表

 分表是将一个大表按照一定的规则分解成多张具有独立存储空间的实体表,我们可以称为子表,每个表都对应三个文件,MYD数据文件,.MYI索引文件,.frm表结构文件。这些子表可以分布在同一块磁盘上,也可以在不同的机器上。app读写的时候根据事先定义好的规则得到对应的子表名,然后去操作它。分表技术是比较麻烦的,需要手动去创建子表,app服务端读写时候需要计算子表名。采用merge好一些,但也要创建子表和配置子表间的union关系。(需要手动分表)

分表是分区之前用的,MYSQL5.1后,就开始用分区代替分表了。分表很少用了。    

### 创建和管理MySQL分区表 #### 1. 分区表的概念 分区表是一种将数据逻辑上存储在一个表中,但在物理上将其拆分成多个部分的技术。这种技术能够有效提高查询性能并简化大规模数据的管理工作[^1]。 --- #### 2. MySQL分区类型概述 MySQL提供了多种类型的分区方式,每种方式适用于不同的场景: - **RANGE分区**: 基于属于某个区间的数据进行划分。 - **LIST分区**: 类似于 RANGE 分区,但是它针对的是离散值列表。 - **HASH分区**: 使用用户定义的表达式的返回值来决定数据分配到哪个分区。 - **KEY分区**: 类似 HASH 分区,不同之处在于 KEY 分区使用 MySQL 自己的哈希函数,并且仅支持基于整数列的操作[^2]。 --- #### 3. 创建分区表的方法 以下是几种常见分区表的创建方法及其语法示例: ##### (1) RANGE 分区 适合用于时间戳或其他有序字段上的分区。 ```sql CREATE TABLE sales ( id INT NOT NULL, sale_date DATE NOT NULL, amount DECIMAL(10, 2) ) PARTITION BY RANGE (YEAR(sale_date)) ( PARTITION p0 VALUES LESS THAN (2020), PARTITION p1 VALUES LESS THAN (2021), PARTITION p2 VALUES LESS THAN (2022), PARTITION p3 VALUES LESS THAN MAXVALUE ); ``` 此语句按照 `sale_date` 的年份进行了范围分区[^3]。 --- ##### (2) LIST 分区 当需要根据特定值集合分割数据时适用。 ```sql CREATE TABLE employees ( emp_id INT NOT NULL, department VARCHAR(20) NOT NULL ) PARTITION BY LIST (department) ( PARTITION dept_sales VALUES IN ('Sales'), PARTITION dept_marketing VALUES IN ('Marketing', 'PR') ); ``` 上述例子展示了如何依据部门名称对员工记录进行分区。 --- ##### (3) HASH 分区 对于均匀分布的需求非常有用。 ```sql CREATE TABLE users ( user_id INT NOT NULL, username VARCHAR(50) NOT NULL ) PARTITION BY HASH(user_id) PARTITIONS 4; ``` 这里指定了四个分区,具体哪一个取决于 `user_id` 的哈希值。 --- ##### (4) KEY 分区 类似于 HASH 分区,但采用内置算法。 ```sql CREATE TABLE orders ( order_id INT NOT NULL AUTO_INCREMENT PRIMARY KEY, customer_name VARCHAR(100) NOT NULL ) PARTITION BY KEY(order_id) PARTITIONS 8; ``` 该命令设置了八个分区,由系统自动计算 hash 函数。 --- #### 4. 查询优化与分区剪枝 如果 SQL 查询条件涉及到了分区键,则 MySQL 可以实现所谓的“分区裁剪”,即只访问那些可能包含所需数据的分区,从而减少 I/O 开销并加速执行过程^。 例如,在上面提到的 `sales` 表中运行如下查询: ```sql SELECT * FROM sales WHERE YEAR(sale_date) = 2021; ``` 由于明确了日期范围,因此只需扫描对应的一个或几个分区即可完成检索操作[^4]。 --- #### 5. 动态维护分区结构 随着业务发展或者历史积累增加,有时我们需要调整现有分区布局。常见的动作包括新增未来时间段的新分片或是移除过期无用的部分。 ##### 添加新分区 继续扩展之前的 `sales` 示例,假设现在要加入代表 2023 年度销售情况的空间: ```sql ALTER TABLE sales ADD PARTITION ( PARTITION p4 VALUES LESS THAN (2023) ); ``` ##### 删除旧有分区 同样还是拿这个案例来说话,假定已经没有必要保留早年的交易详情了就可以这样清理掉它们: ```sql ALTER TABLE sales DROP PARTITION p0; ``` 注意:这些变更均不会影响其他未改动区域内的正常运作状态。 --- ### 总结 通过合理规划和运用各种形式的分区策略,可以极大地改善大型关系型数据库系统的整体表现水平;与此同时也要记得定期审视实际需求变化以便及时作出相应修改措施保持最佳效能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值