建表,并用navicat生成1000w条表数据:
在数据库中生成大量的测试数据时,可以利用内存表插入速度快的特点,先利用函数和存储过程在内存表中生成数据,然后再从内存表插入普通表中,以提高生成速度。
内存表(Memory Table):在某些数据库管理系统(如 MySQL)中,又称为堆表(Heap Table),是一种将数据存储在内存中的表。这种表的特点是读写速度非常快,因为它们直接在内存中进行操作,而不是在磁盘上。然而,内存表的数据是临时的,一旦数据库重启或崩溃,表中的数据将会丢失。
DROP TABLE IF EXISTS `test_user`;
CREATE TABLE `test_user`(
`id` INT NOT NULL AUTO_INCREMENT COMMENT '主键',
`name` VARCHAR(50) DEFAULT '' COMMENT '用户名称',
`email` VARCHAR(50) NOT NULL COMMENT '邮箱',
`phone` VARCHAR(20) DEFAULT '' COMMENT '手机号',
`password` VARCHAR(100) NOT NULL COMMENT '密码',
`age` TINYINT DEFAULT '0' COMMENT '年龄',
`create_time` DATETIME DEFAULT NOW(),
`update_time` DATETIME DEFAULT NOW(),
PRIMARY KEY (`id`)
)ENGINE = INNODB DEFAULT CHARSET=utf8mb4;

注:如果报错 Multi-statement transaction required more than 'max_binlog_cache_size' bytes of storage; increase this mysqld variable and try again,可以把 max_binlog_cache_size 设置大一点(2M),具体如下:
SET GLOBAL max_binlog_cache_size = 2*1024*1024*1024;
SHOW VARIABLES LIKE 'max_binlog_cache_size';
测试不同的查询方式:
# 常规查询
SELECT * FROM test_user
LIMIT 9999900, 100; # 6.285 s
# 先查id,利用主键索引加速查询
SELECT * FROM test_user a, (
SELECT id FROM test_user
LIMIT 9999900, 100
) b
WHERE a.id = b.id; # 2.477 s
# 如果主键自增,则直接按主键降序排列后取前100行
SELECT * FROM test_user
ORDER BY id DESC
LIMIT 100; # 0.024 s
总结:
如果主键自增,直接按照主键降序然后取前100行,这样效率是最高的;
如果主键不自增(例如使用了UUID或雪花算法生成主键id),则可以考虑使用子查询先查出目标的id,然后回表查询。
数据量过大时,最好先考虑进行分库分表,再优化查询语句。
参考:超过1000w条数据,MySQL查询越来越慢?四种方案帮你解决!
3548

被折叠的 条评论
为什么被折叠?



