数据库数字参考表的妙用

最新推荐文章于 2025-01-14 10:44:00 发布

转载最新推荐文章于 2025-01-14 10:44:00 发布 · 554 阅读

文章标签：

#数据库 #insert #table #null #schema #date

SQL 专栏收录该内容

0 篇文章

订阅专栏

今天的主角就是数字参考表，什么是数字参考表？一个表中，存放了从1开始连续到很大值的数字的表，我们称为数字参考表。

DROP TABLE IF EXISTS ref_number;
CREATE TABLE `ref_number` (
  `id` INT(11) NOT NULL AUTO_INCREMENT,
  `status` TINYINT(3) DEFAULT 0 NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=INNODB DEFAULT CHARSET=utf8

#填充数据的存储过程

DELIMITER $$
USE `test`$$
DROP PROCEDURE IF EXISTS `sp_pCreateNums`$$
CREATE DEFINER=`root`@`localhost` PROCEDURE `sp_pCreateNums`( cnt INT UNSIGNED)

BEGIN
DECLARE s INT UNSIGNED DEFAULT 1;
TRUNCATE TABLE ref_number;
WHILE s <= cnt DO
BEGIN
INSERT INTO ref_number(id) SELECT s;
SET s= s+1;
END;
END WHILE;
    END$$
DELIMITER ;

主题就是数据库中参考表的妙用，我们分三种需求来分别说明数据库中参考表的使用，主要针对解决数据库的“历史问题”。

一、两个事务同时锁定一个不存在id导致的死锁

两个事务同时向数据库插入记录，插入的id是一样的。插入前查询表中是否存在这个id，如果不存在，那么会给这个id上锁。mysql允许多个事务给同一条不存在的记录上锁，
然后在插入记录，这个时候就产生冲突和死锁。
解决这个问题的方法还是挺多。
方案一：有可能的话，尽量使用auto_increment。
方案二：如果不能使用auto_increment，程序尽量维护这个id的唯一性，不要重复使用。
方案三：引入参考表。
如果业务表不能建立auto_increment，也不方便做一个算法来维护这个唯一性的列，那么我们建立一个数字参考表，如开始建立的ref_number表。

id列对应业务的id列，status对应这个列是否被使用，0为未使用，1为使用，修改业务表之前先从数字参考表中获取一个未使用的id，
然后修改参考表的状态值，在使用这个值插入到表中，这样就不会因为两个事务锁住同一个不存在的id而产生死锁。

二、两张同时有写入的表之间数据同步，如何处理自增长主键的冲突问题。

这个问题在特殊的情况下才会出现，主要是前期规划和后期需求的冲突导致的。
首先描述一下需求和环境：
一个数据库实例里有两个数据库(schema)，两个数据库内分别有两个表。php.test和java.test。
test表大概如下：

CREATE TABLE `test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `status` tinyint(3) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

这个schema中表结构大致一样，记录也是一样的，只是字段多少而已。现在的问题是多个团队和功能会往这两个表插入数据，还有程序需要对这两个表做双向同步，保证他们数据一致性。

现在我们模拟插入两条数据。

insert into php.test values ('','mysqlops');结果 1，mysqlops
insert into java.test values ('','mysqlops');结果 1，mysqlops

这样在做数据表的双向同步就产生了冲突。
我能想到的解决方案有以下几个：
1、值留一个表，取消另外一个表，这个是最简单最理想的方案了。不过理想和现实往往有很大差距。
由于两个表存在有一定差异性，不同团队的代码都对两个表有依赖关系，所以暂时还没法实施，但最终会这样(我希望最终会这样)。
2、取消auto_increment，程序能够产生唯一有意义的主键，现在还没有找到可用和可控制的唯一标识代替auto_increment。
由于是多个团队操作这两个表，程序生成自增长id也是不现实的。
3、使用主主复制，php和java分开在不通的master上写入，调整auto_increment的offset，来保证每个服务器的auto_increment和对方是不冲突的。
这也是我们现在使用的方法，不过问题在于启用了master-master的双主写入，在架构维护上有一些问题，比如没法做到HA，数据库迁移或者操作的时候限制更多。
4、也就是我们今天说的参考表。
建立一个参考表，php和java先去参考表获取一个没有使用的id，然后把参考表上这个id的状态置为已使用，然后使用获取的id插入到自己操作的表中。
这个方案相对修改代码较少，对数据库架构也没有影响。

三、在某些查询时候需要使用的参考数据

下面的方法主要吸收与姜老的《mysql技术内幕 sql编程》
1、查询一个字段连续的值有哪些，这个需要数字参考表。
这个查询和数字参考表没太大关系，主要使用的是临时生成的行号，不过特别有趣，分享给大家。

create table t(a int unsigned not null primary key);
insert into t select 1;
insert into t select 2;
insert into t select 3;
insert into t select 100;
insert into t select 101;
insert into t select 103;
insert into t select 104;
insert into t select 105;

求出哪些是连续的，并给出连续的范围。

SELECT
  MIN(a) start_range,
  MAX(a) end_range
FROM
  (SELECT
    a,
    rn,
    a-rn AS diff
  FROM
    (SELECT
      a,
      @a := @a + 1 rn
    FROM
      t ,
      (SELECT
        @a :=0) AS a) AS b) AS c
GROUP BY diff ;

2、使用数字参考表可以更快的预建立时间维度表

DELIMITER $$
USE `test`$$
DROP PROCEDURE IF EXISTS `sp_createTimeDim`$$
CREATE DEFINER=`root`@`localhost` PROCEDURE `sp_createTimeDim`(START DATE,END DATE)
BEGIN
SELECT DATE_ADD(START,INTERVAL id-1 DAY) FROM ref_number WHERE id<=DATEDIFF(END,START)+1;
    END$$
DELIMITER ;

文章转自：http://www.mysqlops.com/2012/06/15/%e6%95%b0%e6%8d%ae%e5%ba%93%e6%95%b0%e5%ad%97%e5%8f%82%e8%80%83%e8%a1%a8%e7%9a%84%e5%a6%99%e7%94%a8.html