数据不一致
上图是Ext2结构图,其他FS结构类似。
一般来说,我们将 inode table 与 data block 称为数据区;至于其他例如 superblock、 block bitmap 与 inode bitmap 等称为 metadata (元数据)。
以新增一个文件为例,看看FS操作流程
1. 先确定使用者对于欲新增文件的目录是否具有 w 与 x 的权限,若有的话才能新增;
2. 根据 inode bitmap 找到没有使用的 inode 号码,并将新文件的权限/属性写入;
3. 根据 block bitmap 找到没有使用中的 block 号码,并将实际的数据写入 block 中,且更新 inode 的 block 指向数据;
4. 将刚刚写入的 inode 与 block 数据同步更新 inode bitmap 与 block bitmap,并更新 superblock 的内容。
一般正常的情况下,上述的新增动作可以顺利完成。但是如果再文件写入FS时,某种原因导致系统中断(突然停电 或者 kernel发生错误),
此时写入的数据仅有 inode table 及 data block,元数据metadata还没有来得及更新,就会发生metadata与数据区数据不一致情况。
日志文件系统
在早期的 Ext2 文件系统中,如果发生这个问题, 那么系统在重新开机的时候,就会借由Superblock 当中记录的 valid bit (是否有挂载) 与 filesystem state (clean 与否) 等状态来判断是否强制进行数据一致性的检查!若有需要检查时则以 e2fsck 这支程序来进行的。
整个检查过程十分耗时,因为要搜寻整个FS,针对 metadata 区域与实际数据存放区来进行比对。如果你的文件系统有 100GB 以上,而且里面的文件数量又多时, 那等待时间将会更长。这就催生了日志文件系统的产生。
使用日志FS,日志中会记录将某个文件写入磁盘这一作业,文件顺利写入后,再将日志中的作业删除。 如果在文件写入过程中突然断电,Linux会在启动时检查文件系统的日志并撤销回退任何没有完成的作业。 虽然在数据不一致时都进行了数据检查,但是Ext2是对整个FS进行检查,在服务器环境是这可能会花费数小时时间,而Ext3仅对出问题的文件进行一致性检查,数度上会快很多。