日志是innodb一个非常重要的模块,在innodb中有两类日志:redo log和undo log。其中redolog日志是用来做数据异常恢复和重启时页数据同步恢复的,redo log是建立在在mini transaction基础上。数据库在执行事务时,通过minitransaction产生redo log来保证事务的持久性。

1.mini transaction三个协议

mini-transcation是用来实现innodb的物理逻辑日志的写入和页恢复的,通过mini-transcation来保证并发事务操作和数据库异常是页的一致性。为了得到页的一致性,mini-transaction遵循以下三个协议:

1. The FIX Rules

2. Write-Ahead Log

3. Force-log-at-commit

1.1The FIX Rules

The FIX Rules规定如下:

修改一个页需要获得该页的x-latch

访问一个页是需要获得该页的s-latch或者x-latch

持有该页的latch直到修改或者访问该页的操作完成

1.2Write-Ahead Log

Write-Ahead Log的意思就是如果一个页操作在写入到持久设备时,必须内存中相对应的日志写入到持久化设备中。每个页有一个LSN,每次页修改需要维护这个LSN,当一个页需要写入到持久化设备时,要求内存中小于该页LSN的日志先写入到持久化设备中。日志写完后,先Fixed这个页的latch,再将内存中的页刷盘。完成刷盘后,释放页latch。这里遵循The FIX Rules协议。

1.3 Force-log-at-commit

一个事务可以同时修改了多个页,Write-AheadLog单个数据页的一致性,无法保证事务的持久性。Force -log-at-commit要求当一个事务提交时,其产生所有的mini-transaction日志必须刷到持久设备中。这样即使在页数据刷盘的时候宕机,也可以通过日志进行redo恢复。

2 mini-transaction的日志实现

innodb是采用mini-transaction来构建操作的物理逻辑日志的,在事务执行的时候,会通过mtr来保证页的数据一致性和持久性。mini-transaction是通过一个mtr_t的结构来实现mini-transaction的三个协议。mtr_t的定义如下:

typedef struct mtr_struct
    {
         ulint	 state;                      /*mtr的状态,MTR_ACTIVE、MTR_COMMITING、MTR_COMMITTED*/
         dyn_array_t	 memo;        /*正在持有的latch列表*/
         dyn_array_t	 log;             /*mtr产生的日志数据*/
         ibool	 modifications;     /*是否修改了页*/
         ulint	 n_log_recs;            /*log操作页的个数*/
         ulint	 log_mode;             /*log操作模式,MTR_LOG_ALL、MTR_LOG_NONE、MTR_LOG_SHORT_INSERTS*/
         dulint	 start_lsn;              /*mtr起始的LSN*/
         dulint  end_lsn;             /*mtr结束的LSN*/
         ulint  magic_n;             /*魔法字*/
    }mtr_t;

其中成员memo是个latch持有状态的数组列表,采用的是dyn_array_t的动态内存结构来保存的,每个单元存储的是mtr_memo_slot_t这样的结构。定义如下:

typedef struct mtr_memo_slot_struct
        {
             ulint	 type;            /*latch的类型值*/
             void*	 object;        /*latch对象句柄,可以是rw_lock_t或者buf_block_t*/
        }mtr_memo_slot_t;

latch类型如下:
MTR_MEMO_PAGE_S_FIX /*rw_locks-latch*/
MTR_MEMO_PAGE_X_FIX /*rw_lockx-latch*/
MTR_MEMO_BUF_FIX /*buf_block_t*/
MTR_MEMO_S_LOCK /*rw_lock s-latch*/
MTR_MEMO_X_LOCK /*rw_lock x-latch*/

memo的latch管理接口
mtr_memo_push 获得一个latch,并将状态信息存入mtr memo当中
mtr_release_s_latch_at_savepoint 释放memo偏移savepoint的slot锁状态
mtr_memo_contains 判断锁对象是否在memo当中
mtr_memo_slot_release 释放slot锁的控制权
mtr_memo_pop_all 释放所有memo中的锁的控制权

mt_t中的log成员是也是一个dyn_array_t动态结构的内存,用来保存mtr产生的日志信息。日志的写入是通过mtr0log.h来写入的。这里指的一提的是日志格式,日志格式是有日志头和日志体组成,日志头信息是由type、space和page no组成,由mlog_write_initial_log_record_fast函数写入到mtr_t的log中的。以下是一个比较具体的示意图:

\ <喎"http://www.2cto.com/kf/ware/vc/" target="_blank" class="keylink">vcD4KPHAgYWxpZ249"left">log body的数据写入是通过mtr0log.h中的日志写入方法进行写入的。每写入一跳操作日志,n_log_recs会加1.

标识modifications是标识是否有page的数据改动,如果有,在mtr_commit调用时会先将mtr->log刷盘,然后释放mtr所有的所控制权。日志会一定会在mtr结束时刷盘,这符合Force-log-at-commit的规定。日志写入调用的是log_write_low这个函数。

2.1 mtr_t的内存结构关系图

\

3 总结

mini transaction是innodb对ACID中的持久性的最小保证单元,所有涉及到事务执行、页数据刷盘、redo log数据恢复等都需要进行mini transaction的构造和执行。几乎所有的模块都涉及到mini transaction,例如:btree、page、事务、inser tbuffer、redo-log等,d对mini transcaion的理解不能孤立的去看源代码,应该结合redo log、page相关的代码了解。它是理解innodb工作原理的基石。