MySQL 研究innodb_max_purge_lag分享

解决MySQL undo log过大问题

最新推荐文章于 2024-09-24 19:55:51 发布

原创最新推荐文章于 2024-09-24 19:55:51 发布 · 650 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#mysql

MySQL 专栏收录该内容

5 篇文章

订阅专栏

本文分析了MySQL中undo log过大的原因，并提供了解决方案，包括控制删除速度、使用truncate替代delete等策略。

[size=x-large]现象：[/size]
[size=medium]线上数据库每个表分配一个ibdata,但是总的ibdata文件很大，超过10G，用相关工具查看，大部分空间都是undo_log

分析了db33的ibdata1的记过
Total number of page: 2398464: 2.4M的page * 16K = 38G
Insert Buffer Free List: 2659
B-tree Node: 5720
Freshly Allocated Page: 12725
Undo Log Page: 2352027
File Segment inode: 25333
可以看到绝大部分的空间，都是被undo log占用了....[/size]

[size=large]分析：[/size]
[size=medium]undo log 过大看来是Mysql的一个“problematic feature” 从03年到现在一直都有人抱怨这个问题。有补丁(需要自己修改源码编译)，但是不知道是否可靠...
[url]http://bugs.mysql.com/bug.php?id=57611[/url]
[url]http://bugs.mysql.com/bug.php?id=1341[/url]
出现的原因的一个可能原因：purge 线程赶不上速度，没有即使回收不用的undo page。可以增加一些
这里面[url]http://bugs.mysql.com/bug.php?id=45173[/url] 有人提出一些优化参考的方案：
增大innodb_io_capacity （mysq 5.0不支持 5.1才有）
设置独立的purge thread mysql 5.0不支持，5.5才有
调节 innodb_max_purge_lag 这个值表明，当purge赶不上写操作的时候，写操作delay的时间指标，我们是0，表示不等待，有可能大并发写，purge落后

查看了一下文档，结论：不推荐用innodb_max_purge_lag来实现undo log扩充的问题。
主要原因如下：
1，innodb_max_purge_lag调节参数不好设定，调整不好会强烈影响到正常insert,update的时效，得不偿失
2，innodb_max_purge_lag，有人实验证明，该参数调节影响不是很大，对delete,insert没有作用，副作用大，强烈不推荐 [url]http://mysqldump.azundris.com/archives/81-DELETE,-innodb_max_purge_lag-and-a-case-for-PARTITIONS.html[/url]

undo log较大的原因是：
1，Mysql 每10S操作一次purge
2，每次purge mysql做多回收20 page 的undo log

如果10S之内删除,update的数据操作20 page，也就是320K的东西,就会出现purge 回收不及时的情况，就会出现undo log过大。

对应的 queue表，是删除过一次，平均queue数据长度为292 因此只要1S删除queue表超过100行，就会出现上述情况。因此只要线上大规模 delete 数据就会出现删除不干净的情况。[/size]

[size=x-large]解决方案：[/size]
[size=medium]1，delete操作，脚本控制，不要一口气删除感觉，要sleep，控制在1S删除100条的速度这个已经证明是一个非常好的方案。删除短信数据的时候，如果速度过快，ibdata显著增加，如果控速适当，该文件是根本不会增加的
2, 如果是全表删除，推荐truncate，ddl不会写undo
3, 如果是delete + where 删除的需求，也可以考虑建立新表，导入部分旧表数据＋truncate 旧表的方式，
4, DAO层面支持分表操作，彻底去掉删除大表数据这种事情[/size]