关于checkpoint的讨论

最新推荐文章于 2024-07-26 17:26:01 发布

原创最新推荐文章于 2024-07-26 17:26:01 发布 · 5.8k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#oracle #thread #file #buffer #磁盘 #system

本文围绕Oracle数据库的Checkpoint展开，介绍了其定义，即把已修改数据从高速缓存刷新到磁盘并更新控制文件和数据文件。阐述了触发Checkpoint的多种情况，还讲解了增量检查点机制，以及检查点队列相关知识，包括队列结构、锁存器等内容。

部署运行你感兴趣的模型镜像

http://www.cnoug.org/viewthread.php?tid=21969

贴主： wanghai

checkpoint小议

什么是checkpoint?
checkpoint是一个数据库事件，它将已修改的数据从高速缓存刷新到磁盘，并更新控制文件和数据文件。

什么时候发生checkpoint?
我们知道了checkpoint会刷新脏数据，但什么时候会发生checkpoint呢？以下几种情况会触发checkpoint。
1.当发生日志组切换的时候
2.当符合LOG_CHECKPOINT_TIMEOUT，LOG_CHECKPOINT_INTERVAL，fast_start_io_target,fast_start_mttr_target参数设置的时候
3.当运行ALTER SYSTEM SWITCH LOGFILE的时候
4.当运行ALTER SYSTEM CHECKPOINT的时候
5.当运行alter tablespace XXX begin backup，end backup的时候
6.当运行alter tablespace ,datafile offline的时候;

增量检查点（incremental checkpoint）
oracle8以后推出了incremental checkpoint的机制，在以前的版本里每次checkpoint时都会做一个full thread checkpoint,这样的话所有脏数据会被写到磁盘，巨大的i/o对系统性能带来很大影响。为了解决这个问题，oracle引入了checkpoint queue机制，每一个脏块会被移到检查点队列里面去，按照low rdb（第一次对此块修改对应的redo block address）来排列，靠近检查点队列尾端的数据块的low rba值是最小的，而且如果这些赃块被再次修改后它在检查点队列里的顺序也不会改变，这样就保证了越早修改的块越早写入磁盘。每隔3秒钟ckpt会去更新控制文件和数据文件，记录checkpoint执行的情况。

数据字典
完全检查点
select * from X$KCCRT where indx=0;

ADDR          INDX INST_ID    RTNUM    RTSTA RTCKP_SCN       RTCKP_TIM          RTCKP_THR RTCKP_RBA_SEQ RTCKP_RBA_BNO RTCKP_RBA_BOF RTCKP_ETB       RTOTF    RTOTB    RTNLF    RTLFH    RTLFT    RTCLN    RTSEQ RTENB          RTETS RTDIS          RTDIT                   RTLHP RTSID          RTOTS
-------- ---------- ---------- ---------- ---------- ---------------- -------------------- ---------- ------------- ------------- ------------- ---------------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------------- -------------------- ---------------- -------------------- ---------- ---------------- --------------------
4084B228       0       1       1       15 720368521       06/25/2004 18:49:37          1          949          2    16 0600000000000000       2       0       3       1       3       1       949 1             05/16/2004 13:29:03  0                                              1389 tbdb2in1       06/12/2004 12:30:50

这里显示了上一次的完全检查点是在06/25/2004 18:49:37发生，所以我们推断06/25/2004 18:49:37发生了一次日志切换，再去操作系统上去看生产的归档，果然18：49有一个归档生产。
-rw-r----- 1 oracle oinstall 83532800 Jun 25 18:49 1_948.dbf

增量检查点
SQL> select * from X$KCCCP where indx=0;

ADDR          INDX INST_ID    CPTNO    CPSTA    CPFLG    CPDRT    CPRDB CPLRBA_SEQ CPLRBA_BNO CPLRBA_BOF  CPODR_SEQ  CPODR_BNO  CPODR_BOF CPODS             CPODT                CPODT_I    CPHBT CPRLS                CPRLC    CPMID  CPSDR_SEQ  CPSDR_BNO  CPSDR_ADB
-------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------- ---------------- -------------------- ---------- ---------- ---------------- ---------- ---------- ---------- ---------- ----------
4084B45C       0       1       1       2       0    10762    29753       949    76847       0       949    106814             0 721554970       06/25/2004 21:05:10 529794310  529036227 1                526310932 1413781667       949             1       0

这里显示了low-rba,on-disk rba,checkpoint time等信息。

biti_rainy:

每隔3秒钟ckpt会去更新控制文件和数据文件，记录checkpoint执行的情况。

这里应该是只更新控制文件，每3秒不是更新数据文件
说记录 checkpoint 的执行情况，这个说法，没错，但不够详细，应该说，由于增量检查点和 checkpoint queue 的原理，ckpt 进程每次只是告诉 dbwr ，写dirty buffer将要一直写到最新这个位置，仅仅是告诉 dbwr 一个 checkpoint queue 中的结束点，而 ckpt 每3秒中，在控制文件中报告一下 dbwr 最新写入的位置。这样使得，比如数据库要做恢复的时候（instance recovery）可以从这个最新位置开始做恢复，而不是从数据文件中的 checkpoint scn 开始做恢复，这样将缩短恢复时间，尤其是 instance crash 的情况下启动更快

另外要注意的是，检查点发生的时候，ckpt 去更新数据文件头和控制文件，并不是把当前检查点发生时候的 scn 更新进去，而是把上一次dbwr写入已经完成的检查点发生时候的 scn 更新进去，也就是说，更新控制文件和数据文件头是滞后于检查点的发生的，这个从恢复的原理也很容易理解，因为检查点发生的时候 dirty buffer还没有写入，自然不能立即更新成当前的 scn 了。

jerrysun 转：

something about checkpoint queue latch

wanghai, the following is just for your reference. :)

Firstly we have two queue structures associated with checkpoints - the checkpoint queue - or thread queue - (CKPTQ), and the file queue.For each buffer to be checkpointed, it is linked to these two queues. The CKPTQ contains all buffers that need to be checkpointed for this instance.  The File queue contains all buffers that belong to a specific file that need to  be checkpointed. There is one file queue per file. The file queues are used by tablespace checkpoint requests.

Both these queues constitute a set of checkpoint queues.

Before a process can put a buffer on a checkpoint queue, it must make sure that the queue is not being used. There is one checkpoint queue latch per set of  checkpoint queues, that is used to control access to these queues. To reduce contention on this latch, the set of thread and file queues is replicated as per the number of working sets for the instance.

The determination of the number of working sets has changed across the DB versions.  For 9.2, the default number is calculated
internally as #CPUs  / 2 * 8.

The maximum of DBWR's (db_writer_processes) you can have at 9.2 is 20.  Working sets are assigned to DBWR's in a round-robin
fashion at startup.

关于checkpoint queue 与 write list 的关系，请参考

http://blog.youkuaiyun.com/biti_rainy/archive/2004/08/01/learn_oracle_20040801_1.aspx

您可能感兴趣的与本文相关的镜像

Wan2.2-T2V-A5B

文生视频

Wan2.2

Wan2.2是由通义万相开源高效文本到视频生成模型，是有50亿参数的轻量级视频生成模型，专为快速内容创作优化。支持480P视频生成，具备优秀的时序连贯性和运动推理能力

4 条评论

SevenChina 2008.10.27
"另外要注意的是，检查点发生的时候，ckpt 去更新数据文件头和控制文件，并不是把当前检查点发生时候的 scn 更新进去，而是把上一次dbwr写入已经完成的检查点发生时候的 scn 更新进去，也就是说，更新控制文件和数据文件头是滞后于检查点的发生的，这个从恢复的原理也很容易理解，因为检查点发生的时候 dirty buffer还没有写入，自然不能立即更新成当前的 scn 了。"　有歧义。这段话怎么解释关库的时候发生的检查点？

SevenChina 2008.10.27
"另外要注意的是，检查点发生的时候，ckpt 去更新数据文件头和控制文件，并不是把当前检查点发生时候的 scn 更新进去，而是把上一次dbwr写入已经完成的检查点发生时候的 scn 更新进去，也就是说，更新控制文件和数据文件头是滞后于检查点的发生的，这个从恢复的原理也很容易理解，因为检查点发生的时候 dirty buffer还没有写入，自然不能立即更新成当前的 scn 了。"　有歧义。这段话怎么解释关库的时候发生的检查点？

biti_rainy 2004.08.01
wanghai－www.cnoug.org 说： 讨论个问题哦 人生就是如此说： ？ wanghai－www.cnoug.org 说： dbwr现在从lruw选择block往外写还是从ckpt queue wanghai－www.cnoug.org 说： 早上和cp,parrotao谈论了一下没什么定论 人生就是如此说： dbwr 都是从 ckpt queue 往外写啊 wanghai－www.cnoug.org 说： 对，但这样lruw的存在还有什么意义 人生就是如此说： lru w 有好几种类型 人生就是如此说： ckpt queue 我不确信是不是一个统称 wanghai－www.cnoug.org 说： 看dsi描述的ckpt queue和lruw是分开的 wanghai－www.cnoug.org 说： steve也是把这几个东西分开的，但是我还不确定lruw和ckpt queue的关系 人生就是如此说： lru w 是不是有几种类型？ wanghai－www.cnoug.org 说： metalink上好像也有人问有了ckpt queue为什么还要lruw wanghai－www.cnoug.org 说： 有几种的 人生就是如此说： 所以我怀疑 ckpt queue 是只有一个，因为几种类型统一起来 wanghai－www.cnoug.org 说： ckpt queue我认为是一个，和lruw有几个应该没关系 wanghai－www.cnoug.org 说： 这样的话lruw就有别的意义了，如果不从lruw往外写的话 人生就是如此说： dirty buffer 也可能有几种状态啊 wanghai－www.cnoug.org 说： When DBWn has written a batch of blocks from the write list it moves the buffers back to the LRU end of the replacement list (in reverse order). wanghai－www.cnoug.org 说： steve也不没明确说到底是ckpt queue还是lruw 人生就是如此说： ckpt q 是8 才出现的吧，这个同时支持了 slave 模拟 AIO 的概念 人生就是如此说： 实际上，AIO 可能也和这个有关系 wanghai－www.cnoug.org 说： 可能 wanghai－www.cnoug.org 说： <a target="_new" href="http://www.ixora.com.au/q+a/0103/07160329.htm">http://www.ixora.com.au/q+a/0103/07160329.htm</a> wanghai－www.cnoug.org 说： 会不会可能ckpt queue也是其中一种write list的称呼而已 人生就是如此说： For completeness it should also b