MySQL内核月报 2015.03-MySQL · 捉虫动态· pid file丢失问题分析

现象

mysql5.5,通过命令show variables like '%pid_file%'; 可以查到pid文件位置,例如/home/mysql/xx.pid。但发现在此目录下找不到此pid文件。


背景知识

mysql pid文件记录的是当前mysqld进程的pid。

通过mysqld_safe启动mysqld时,mysqld_safe会检查PID文件,未指定PID文件时,pid文件默认名为$DATADIR/`hostname`.pid

  • pid文件不存在,不做处理
  • 文件存在,且pid已占用则报错"A mysqld process already exists";文件存在,但pid未占用,则删除pid文件。

mysqld启动后会通过create_pid_file函数新建pid文件,通过getpid()获取当前进程pid并将pid写入pid文件。

因此,通过mysqld_safe启动时,pid文件的作用是为了防止同一个数据库被启动多次(数据文件是同一份,但端口不同的情况)。

另一个事实是mysqld在正常关闭时或通过SIGQUIT,SIGKILL,SIGTERM信号来kill mysqld时,会调用clean_up函数将pid文件删除。而mysqld异常crash时,pid文件是保留的。


另外mysqld_safe有一个功能是当mysqld异常crash时,后台会自动重启mysqld。mysqld关闭后,mysqld_safe会检查pid文件是否存在。如果存在则认为mysqld是异常crash, 需要自动重启;如果不存在则认为是正常关闭的,不需要自动重启,mysqld_safe程序也退出。


原因分析


查看error log发现数据库在相近的时间内启动了两次


前面说到mysqld_safe启动mysqld时,会根据pid文件来判断避免重复启动mysqld.然而,由于两次启动时间较近,导致第一次mysqld启动生成pid文件之前,第二个mysqld就已开始启动了,从而绕过了这个判断。第一次mysqld启动会成功,而第二次mysqld启动会因为文件锁而导致启动失败。


第二次启动的mysqld关闭时会将第一次启动时产生的pid文件删除,从而导致pid文件丢失。

通过mysqld_safe启动mysqld来重现pid文件丢失有一定的概率性,必须是同时启动mysqld_safe。 如果是直接通过mysqld启动,同时指定相同的参数启动两次,那么就很容易重现了。


修复


参考5.6 官方的修复方法,在上述场景下删除pid文件时,需判断是否是自己新建的pid文件,同时文件中的pid是否和自身pid一致,否则不能删除。参考补丁

MySQL · 答疑释惑· using filesort VS using temporary

背景

MySQL 执行查询语句, 对于order by谓词,可能会使用filesort或者temporary。比如explain一条语句的时候,会看到Extra字段中可能会出现,using filesort和using temporary。下面我们就来探讨下两个的区别和适用场景。

解释

1. using filesort

filesort主要用于查询数据结果集的排序操作,首先MySQL会使用sort_buffer_size大小的内存进行排序,如果结果集超过了sort_buffer_size大小,会把这一个排序后的chunk转移到file上,最后使用多路归并排序完成所有数据的排序操作。

MySQL filesort有两种使用模式:

模式1: sort的item保存了所需要的所有字段,排序完成后,没有必要再回表扫描。
模式2: sort的item仅包括<sort_key, rowid>,待排序完成后,根据rowid查询所需要的columns。

很明显,模式1能够极大的减少回表的随机IO。

2. using temporary

MySQL使用临时表保存临时的结构,以用于后续的处理,MySQL首先创建heap引擎的临时表,如果临时的数据过多,超过max_heap_table_size的大小,会自动把临时表转换成MyISAM引擎的表来使用。


从上面的解释上来看,filesort和temporary的使用场景的区别并不是很明显,不过,有以下的原则:

filesort只能应用在单个表上,如果有多个表的数据需要排序,那么MySQL会先使用using temporary保存临时数据,然后再在临时表上使用filesort进行排序,最后输出结果。


适用场景

我们看一下下面的三个case:




case 1:


case1: order by字段能够使用index的有序性,所以没有使用filesort,也没有使用temporary。

case 2:


case2: order by谓词,是在第一个表t1上完成,所以只需要在t1表上使用filesort,然后排序后的结果集join t2表。

case 3:


case 3: order by的字段在t2表上,所以需要把t1,t2表join的结果保存到temporary表上,然后对临时表进行filesort,最后输出结果。

特别优化

MySQL对order by + limit的filesort做了特别优化,使用Priority queue来保存结果,即一个堆的结构,只保留top n的数据满足limit条件。

另外

filesort和temporary都会在tmp目录下创建文件,temporary创建的是MYI,MYD文件。但filesort的文件, 因为MySQL使用了create->open->unlink->使用->close的方式,隐藏了文件,以便进程异常结束的时候,临时文件能够自动回收掉,所以在评估tmp目录空间的时候,需要特别注意。


上一篇:Java并发/多线程教程——3多线程的开销


下一篇:GDB调试技巧:gdb at pid无法调试的问题