mysql 对于百万 千万级数据的分表实现方法

首先,我们需要想好到底分多少个表,前提当然是满足应用。这里我使用了一个比较简单的分表方法,就是根据自增id的尾数来分,也就是说分0-9一共10个表,其取值也很好做,就是对10进行取模。另外,还可以根据某一字段的md5值取其中几位进行分表,这样的话,可以分的表就很多了。


CREATE TABLE `test`.`article_0` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_1` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_2` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_3` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_4` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_5` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_6` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_7` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_8` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

CREATE TABLE `test`.`article_9` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE = MYISAM CHARACTER SET utf8 COLLATE utf8_general_ci

 

好了10个表创建完毕了,需要注意的是,这里的id不能设为自增,而且所有的表结构必须一致,包括结构,类型,长度,字段的顺序都必须一致那么对于这个id如何取得呢?后面我会详细说明。现在,我们需要一个合并表,用于查询,创建合并表的代码如下:

    CREATE TABLE `test`.`article` (
`id` BIGINT( 20 ) NOT NULL ,
`subject` VARCHAR( 200 ) NOT NULL ,
`content` TEXT NOT NULL ,
PRIMARY KEY ( `id` )
) ENGINE=MRG_MyISAM DEFAULT CHARSET=utf8 INSERT_METHOD=0 UNION=(`article_0`,`article_1`,`article_2`,`article_3`,`article_4`,`article_5`,`article_6`,`article_7`,`article_8`,`article_9`);

 

 这里INSERT_METHOD=0在某些版本可能不工作,需要改成INSERT_METHOD=NO
注意,合并表也必须和前面的表有相同的结构,类型,长度,包括字段的顺序都必须一致这里的INSERT_METHOD=0表示不允许对本表进行insert操作。好了,当需要查询的时候,我们可以只对article这个表进行操作就可以了,也就是说这个表仅仅只能进行select操作

那么对于插入也就是insert操作应该如何来搞呢,首先就是获取唯一的id了,这里就还需要一个表来专门创建id,代码如下:

 

  CREATE TABLE `test`.`create_id` (
`id` BIGINT( 20 ) NOT NULL AUTO_INCREMENT PRIMARY KEY
) ENGINE = MYISAM

 

也就是说,当我们需要插入数据的时候,必须由这个表来产生id值,我的php代码的方法如下
 

 function get_AI_ID() {
    $sql  "insert into create_id (id) values('')";
    $this->db->query($sql);
    return $this->db->insertID();
}

好了,现在假设我们要插入一条数据了,应该怎么操作呢?还是继续看代码吧

function new_Article() {
    $id  $this->get_AI_ID();
    $table_name $this->get_Table_Name($id);
    $sql "insert into {$table_name} (id,subject,content) values('{$id}','测试标题','测试内容')";
    $this->db->query($sql);
}

function get_Table_Name($id) {
    return 'article_'.intval($id)%10;//这里取模运算起到了画龙点睛的作用
}

 

其实很简单的,就是先获取id,然后根据id获取应该插入到哪个表,然后就很简单了。

对于update的操作应该不需要再说了吧,无非是有了id,然后获取表名,然后进行update操作就好了

### 千万级数据分库分表的设计与实现 对于千万级甚至更规模的数据量,传统的单体数据库可能无法满足性能需求。因此,采用分库分表策略是一种常见的解决方法。以下是关于分库分表设计与实现的最佳实践。 #### 一、分库分表的核心概念 分库分表是指通过一定的规则将原本存放在单一数据库中的数据分布到多个物理数据库或者多张逻辑中。这种技术可以有效缓解单机数据库的压力,提升系统的并发能力和存储能力[^1]。 - **水平拆分**:按照某些字段的取值范围或哈希值来划分数据,适合于规模记录场景。 - **垂直拆分**:按业务模块的同功能属性分离成同的子系统,适用于同业务间关联度较低的情况[^2]。 #### 二、分库分表的技术选型 目前市面上存在多种成熟的分库分表中间件和技术方案,开发者可以根据实际需求选择合适的工具: - **Sharding-JDBC**:一款轻量级 Java 框架,支持透明化 SQL 解析和分布式事务等功能,易于集成至现有项目中[^3]。 - **Vitess**:专为 MySQL 设计的规模集群管理平台,尽管在国内应用较少,但在高可用性和可扩展性方面现优异。 - **Mycat** 和其他类似的代理层产品也提供了丰富的特性集以应对复杂的查询请求模式[^4]。 #### 三、具体实施步骤概述 虽然允许使用诸如“首先”这样的引导词,但仍可通过列举的方式描述整个流程的关键环节: 1. 明确业务边界并定义好哪些部分需要被分割出去; 2. 制定合理的切分标准(比如时间戳区间或是用户ID模数运算结果作为路由依据); 3. 编写迁移脚本完成历史存量数据转移工作; 4. 调整应用程序代码使其能够正确访问新的目标位置上的资源文件夹结构等等; 注意这里提到的内容并非线性的执行顺序而是相互交织在一起共同作用的过程。 #### 四、注意事项及优化建议 当面对超容量格时需特别留意以下几个方面的问题及其对应的进措施: - 性能瓶颈: 随着分区数量增加可能会带来额外开销, 可考虑引入缓存机制减少频繁IO操作次数. - 数据一致性维护困难: 借助两阶段提交协议(Two-phase Commit Protocol) 或者 sagas pattern 来保障跨节点之间更新动作同步成功与否的一致状态. ```sql -- 创建分片后的结构示例 CREATE TABLE user_order ( order_id BIGINT NOT NULL, user_id INT NOT NULL, product_name VARCHAR(255), PRIMARY KEY (order_id) ); PARTITION BY HASH(user_id) PARTITIONS 8; ``` 上述SQL语句展示了如何利用hash算法对`user_id`列进行散列从而达到自动分配的目的. ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值