同步机制
Innodb实现了不依赖于平台的mutex,rwlock。
1. 全局变量
对于mutex, rwlock,都有一个全局链表。
1. mutex全局链表:mutex_list
2. rwlock全局链表:rw_lock_list
在create创建mutex 或者rwlock的时候,加入链表。
在delete销毁mutex或者rwlock的时候,从链表中删除。
3. 全局等待数组:
sync_primary_wait_array = sync_array_create(OS_THREAD_MAX_N, SYNC_ARRAY_OS_MUTEX);
srv_max_n_threads决定了数组的大小,即同时wait的线程数。
2. mutex
struct mutex_struct { os_event_t event; volatile lock_word_t lock_word; os_fast_mutex_t os_fast_mutex; UT_LIST_NODE_T(mutex_t) list;
event: wait,notify使用的条件变量,在pthread中等同于condition。
lock_word: 如果系统支持TAS指令,那么就直接使用tas指令
os_fast_mutex:如果系统部支持TAS,那么在linux环境下就是封装的pthread_mutex;
list: innodb中的所有mutex都维持一个链表。
假设我们讨论的平台是x86-64位的linux系统。
mutex的相关函数:
mutex_create_func: 创建mutex,condition
mutex_own:判断是否是当前线程持有mutex
mutex_enter:获取mutex,使用的是trylock方式,如果不能获取,则进入spin,仍然不能获取,则进入等待队列
mutex_exit:释放mutex。
3. rw_lock:
struct rw_lock_struct { volatile lint lock_word; /*!< Holds the state of the lock. */ volatile ulint waiters; /*!< 1: there are waiters */ os_event_t event; /*!< Used by sync0arr.c for thread queueing */ os_event_t wait_ex_event; mutex_t mutex; UT_LIST_NODE_T(rw_lock_t) list;
相关函数:
rw_lock_create_func: 初始化lock_word #define X_LOCK_DECR 0x00100000 即同时支持1,048,575 concurrent readers
rw_lock_lock_word_decr: 每次获取share_lock,就递减lock _word.
rw_lock_s_lock_spin
rw_lock_x_lock_wait
注:
整体上来看,在linux平台上,mutex,condition的实现仍然使用pthread包中的mutex,cond。 rwlock的实现不依赖于pthread_rwlock.
然后,innodb代码上多次使用数组等结构,增加了mutex的持有和释放的开销。
总的来说,解决了多平台的问题,但引入了部分开销。