MySQL源码之两阶段提交

在双1的情况下,两阶段提交的过程

环境准备:mysql 5.5.18, innodb 1.1 version
配置:
  sync_binlog=1
  innodb_flush_log_at_trx_commit=1
  autocommit=0

设置断点:

sql_parse.cc::dispatch_command --命令跳转入口
sql_parse.cc::mysql_parse
sql_parse.cc::mysql_execute_command
sql_parse.cc::trans_commit_stmt --语句commit入口
handler.cc::ha_commit_trans --commit入口

log.cc::binlog_prepare --binlog prepare入口
Ha_innodb.cc::innobase_xa_prepare --innodb prepare入口

log.cc::binlog_commit --binlog commit入口
Ha_innodb.cc::innobase_commit --innodb commit入口


实验步骤

步骤1:

 use test;
create table xpchild(id int auto_increment primary key, name varchar(100));
insert into xpchild(1,'xpchild');

步骤1过程:

1. dispatch_command:
  command = COM_QUERY
  inc_thread_running():增加thread running
  statistic_increment:增加计数
  switch (command):跳转命令
2. mysql_execute_command:
  解析命令为:SQLCOM_INSERT
3. mysql_insert:
  跳转到真正的insert
  bool log_on= (thd->variables.option_bits & OPTION_BIN_LOG):判断是否打开了binlog
  open_and_lock_tables(thd, table_list, TRUE, 0):打开table并锁表
4. trans_commit_stmt:
  语句级别的提交
  if (thd->transaction.stmt.ha_list)
    res= ha_commit_trans(thd, FALSE);
    针对语句所有参与的引擎进行提交, 但这里all的参数是false,说明是语句的提交动作,而非真正的事务commit。
5. ha_commit_trans:
  这里trans=all ? &thd->transaction.all : &thd->transaction.stmt,说明是stmt的transaction。
  ha_check_and_coalesce_trx_read_only:判断事务是否需要两阶段提交
  for (Ha_trx_info *hi= ha_info; hi; hi= hi->next())
    一共有两个引擎参与:binlog&&innodb


进入prepare阶段:

5.1. binlog_prepare:

     直接返回什么也没有做
5.2. innobase_xa_prepare:
  all参数是false,innodb认为是语句级别的提交,就只做如下的事情:
  row_unlock_table_autoinc_for_mysql(trx);释放语句hold的auto_increment锁
  trx_mark_sql_stat_end(trx);记录本语句的undo信息,以便语句级的回滚

进入提交阶段:

commit_one_phase_low(thd, all, trans, is_real_trans);

5.3. binlog_commit
  只是cache了statement的binlog,没有做flush操作
5.4. innobase_commit
  row_unlock_table_autoinc_for_mysql(trx);释放了自增锁
  trx_mark_sql_stat_end(trx);记录本语句的undo信息  
  这个地方做的事情和prepare阶段一样,多做虽然没有坏处,但也没有看到有什么意义
  srv_active_wake_master_thread:给主线程发信号唤醒,就结束
6. close_thread_tables(thd)
  在mysql_execute_command中close table,然后这次命令就结束了。

步骤2:

  

commit

1. 前面的步骤都相似:
  mysql_execute_command函数中跳转到trans_commit进行真正的提交。

2. ha_commit_trans
  进入commit函数,传入参数all=true,为真正的提交动作。
  检查rw_ha_count= ha_check_and_coalesce_trx_read_only(thd, ha_info, all)
  rw_ha_count=2 代表binlog引擎和innodb引擎
  is_real_trans=true

进入两阶段提交过程:

3. binlog_prepare:
  直接return 0;
4. innobase_xa_prepare:
  trx_prepare_off_kernel:
  mutex_enter(&(rseg->mutex));锁住undo segment的mutex
  trx_undo_set_state_at_prepare;设置这个insert语句所对应的undo的状态从TRX_UNDO_ACTIVE-》TRX_UNDO_PREPARED。
  mutex_exit(&(rseg->mutex));释放mutex
  mtr_commit(&mtr): 对于本次的内存更改,因为非原子操作,所以也对应一个提交动作
  lsn = mtr.end_lsn:或者最后的lsn后,flush的时候要保证大于或者等于lsn。
  if flush_log_at_trx_commit=1
    log_write_up_to(lsn, LOG_WAIT_ONE_GROUP, TRUE); 参数flush_to_disk=true表示flush log到disk中。

5. tc_log->log_and_order:这里做了大部分的commit的工作,包括:
  binlog_commit_flush_trx_cache:刷新binlog到disk
    TC_LOG::run_commit_ordered:
      对binlog进行group commit操作

  innodb::innobase_commit_ordered:
  trx_commit_off_kernel:
    标记事务为TRX_COMMITTED_IN_MEMORY,
    如果是insert undo,直接purge掉。
    trx->flush_log_later=true,所以这里并不进行flush,只是记录了commit的lsn,flush的动作放在了提交阶段。
    trx_roll_free_all_savepoints:释放所有的save_point.
    事务的标记最终为: trx->conc_state = TRX_NOT_STARTED

进入最终提交阶段:
commit_one_phase_low(thd, all, trans, is_real_trans):
  binlog_commit:这里貌似什么都没有做,直接进入
  if (cache_mngr->trx_cache.empty())
    cache_mngr->reset_cache(&cache_mngr->trx_cache)
    所以binlog commit并不是真正flush log的地方,而是在ha_commit_trans函数中,完成prepare过程后,commit提交前做了:
    cookie= tc_log->log_and_order(thd, xid, all, need_commit_ordered);
    所以,其实binlog已经提交了,只不过位置不在这里,不过,不妨碍一致性,因为都是在一阶段完成后。

innobase_commit:
  trx_commit_complete_for_mysql:
    log_write_up_to(lsn, LOG_WAIT_ONE_GROUP, TRUE);刷新log到disk中,这里的lsn是commit_lsn.

到这里commit完整结束。

上一篇:【转】分享10VPN


下一篇:最近点对问题 POJ 3714 Raid && HDOJ 1007 Quoit Design