linux系统无法正常启动,故障排查恢复

linux内核启动修复

首先看一下linux内核重要文件grub.conf

# grub.conf generated by anaconda
#
# Note that you do not have to rerun grub after making changes to this file
# NOTICE: You have a /boot partition. This means that
# all kernel and initrd paths are relative to /boot/, eg.
# root (hd0,0)
# kernel /vmlinuz-version ro root=/dev/sda2
# initrd /initrd-[generic-]version.img
#boot=/dev/sda
default=0 #如果有多个菜单,默认选择的菜单为0
timeout=5 #菜单选项栏等待5s
splashimage=(hd0,0)/grub/splash.xpm.gz #/dev/sda1即/boot下开机启动图片
hiddenmenu #影藏菜单
title CentOS 6 (2.6.32-696.el6.x86_64) #标题为CentOS 6 (2.6.32-696.el6.x86_64),此标题不能没有
root (hd0,0) #第一块磁盘,第1个分区,指的是/boot
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet # kernel相对于/boot的路径,此处根值/boot,kenrl后面跟有系统启动相关参数 rhgb 图形化工具(转圈圈),删除rhgb直接到正常启动界面 quiet默认隐藏内核的启动过程
initrd /initramfs-2.6.32-696.el6.x86_64.img title CentOS 6 (2.6.32-696.el6.x86_64) #标题为CentOS 6 (2.6.32-696.el6.x86_64),此标题不能没有
kernel (hd0,0)/vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet # 没有定义根,后面不能调用只能在前面添加(hd0,0)
initrd (hd0,0)/initramfs-2.6.32-696.el6.x86_64.img

  

 

一 删除/boot/grub/*下所有文件,只保留grub.conf配置文件,系统能否正常启动修复?

linux系统无法正常启动,故障排查恢复
系统能够正常启动
stage2阶段就是一个grub.conf配置文件,其它文件都不起到直接的作用        
此时重新启动系统只会在一开始报一个没有启动图片的错误,此错误不影响系统的正常启动(可忽略),/boot/grub下的所有文件只做暂时备份使用即stage1 stage1_5阶段的备份文件,只有当1和1.5阶段出现故障的时候 可以通过一些命令进行修复,修复的时候会用到此处的备份文件
 

二 破坏MBR的前446字节的信息,修复(stage1阶段修复)

[root@Centos6 ~]# dd if=/dev/zero of=/dev/sda bs=1 count=4426
破坏stage1阶段
linux系统无法正常启动,故障排查恢复
此时发现系统重启进入光盘界面
linux系统无法正常启动,故障排查恢复
重启系统直接进入光盘界面,也就是光盘上的MBR没有启动代码
选择第三项进入救援模式
 
修复步骤
1.切根  chroot /mnt/sysiamge
此时所处的位置并不是磁盘上的根,真正的根位于/mnt/sysimage下
起因:在救援模式自身是不提供grub-install的只有切根才可以
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
 
2.grub-install  /dev/sda  
修复grub,此过程stage[1,1.5,2]都可以修复
此时出现分区别标签的错误,不用管,此步骤容易出现故障
3.sync
同步设置到磁盘,确保磁盘已经写入进去了
此时不仅修复了mbr还修复了grub里面不同stage的文件
4.退出shell,重新启动
总结:此时stage1阶段的恢复完成,主要通过grub-install进行恢复
-------------------------------补充关闭selinux---------------------------
1、重启系统按c键,直接进入grub
grub> kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=/dev/sda2 selinux=0
grub> initrd /initramfs-2.6.32-696.el6.x86_64.img
grub> boot
2、通过修改/etc/sysconfig/selinux     把selinux=disabled

-----------------------------------------------------------------------------------

 

三 破坏512字节之后的内容进行修复(stage1.5阶段过程)

dd if=/dev/zero of=/dev/sda bs=1 count=10240 seek=512
linux系统无法正常启动,故障排查恢复

此时会发现菜单都看不到

stage1.5出故障使用光盘引导
修复步骤:
1.按Esc键进入光盘引导界面
2.选择第三项进入救援模式
3.切根  chroot /mnt/sysimage
4.grub-install或者使用grub命令
sh-4.1# grub
 
linux系统无法正常启动,故障排查恢复
grub>root (hd0,0)     #表示boot在第一块磁盘第1个分区
 
linux系统无法正常启动,故障排查恢复
setup (hd0)      #此步骤依赖于/boot/grub/*下面的文件
 
--------------------------------------------------------------------------------------------------------
表示把grub按在哪个硬盘上,没有写分区的原因在于有一部分是装在MBR里面的即boot分区里面,boot里面有一个目录名为grub,告诉各个路径在什么地方
linux系统无法正常启动,故障排查恢复
-------------------------------------------------------------------------------------------------------------
5.sync   #设置同步到磁盘
6.reboot  #退出shell,重启系统方可恢复
 

四 在“三”的基础上在重新做“一”的操作,再启动会出现报错,状态码为Error 15

linux系统无法正常启动,故障排查恢复
 
修复方案:
如把stage2文件复制到/boot/grup目录下,系统可以重新启动
解释
重启系统,此时可以知道重新安装grub以后stage2并不是起备份作用了,“一”中之所以成功是通过磁盘上别的空间来读取数据,可以明白stage1.5阶段已经成功了
linux系统无法正常启动,故障排查恢复
注:如果后期没有更改时间,grub.conf文件时间就是安装操作系统的时间
linux系统无法正常启动,故障排查恢复
在grub.conf文件下kernel没有写/boot分区是因为boot是一个独立分区,此文件是相对于boot分区,/=/boot
如果没有指定root的位置必须指定kernel,initrd的位置及在前面加上(hd0,0),即为/boot
 

五  如果没有root(hd0,0)且kernel,initrd不指定/boot的位置会出现如下报错

title CentOS 6 (2.6.32-696.el6.x86_64)     #标题为CentOS 6 (2.6.32-696.el6.x86_64),此标题不能没有
kernel vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet # 没有定义根,后面不能调用只能在前面添加(hd0,0)
initrd initramfs-2.6.32-696.el6.x86_64.img
 
linux系统无法正常启动,故障排查恢复
#此时只能进入救援模式切根修改文件
title CentOS 6 (2.6.32-696.el6.x86_64) #标题为CentOS 6 (2.6.32-696.el6.x86_64),此标题不能没有
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet # 没有定义根,后面不能调用只能在前面添加(hd0,0)
initrd /initramfs-2.6.32-696.el6.x86_64.img

  

 

六 如果在默认文件中去掉root (hd0,0)一行系统启动会出现的情况

title CentOS 6 (2.6.32-696.el6.x86_64)
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet
initrd /initramfs-2.6.32-696.el6.x86_64.img
 
开头出现下面的提示,但是系统能够正常的启动
linux系统无法正常启动,故障排查恢复
 
 

七 调换kernel和initrd调换顺序,开机启动情况?

title CentOS 6 (2.6.32-696.el6.x86_64)
initrd /initramfs-2.6.32-696.el6.x86_64.img
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet

  

 
解释:直接报错,大概意思是linux kernel必须在initrd之前加载,否则系统无法启动
只有加载kernel才会知道操作系统的根,找到根了才会找到内存用户驱动
linux系统无法正常启动,故障排查恢复
 
修复步骤
修复方法,显示删除initrd添加一新行,在编辑新行grub> initrd /initramfs-2.6.32-696.el6.x86_64.img
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
 
 

八 单用户模式下可以轻易破解口令,如何明文加密口令?

加上密码口令并不影响启动,只是不能菜单编辑
在title的上一行加上passwd   密码     此时验证的时候不知道都不会成功
password zangfans
 
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
 
验证会出现Failed
 
修复方案
在hidddenmenu上方和initrd下方各插入一行
# grub.conf generated by anaconda
#
# Note that you do not have to rerun grub after making changes to this file
# NOTICE: You have a /boot partition. This means that
# all kernel and initrd paths are relative to /boot/, eg.
# root (hd0,0)
# kernel /vmlinuz-version ro root=/dev/sda2
# initrd /initrd-[generic-]version.img
#boot=/dev/sda
default=0
timeout=5
splashimage=(hd0,0)/grub/splash.xpm.gz
password centos6 #编辑菜单项输入密码
hiddenmenu
title CentOS 6 (2.6.32-696.el6.x86_64)
root (hd0,0)
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet
initrd /initramfs-2.6.32-696.el6.x86_64.img title CentOS 6 (2.6.32-696.el6.x86_64)
kernel (hd0,0)/vmlinuz-2.6.32-696.el6.x86_64 ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSF ONT=latarcyrheb-sun16 crashkernel=auto KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet #
initrd (hd0,0)/initramfs-2.6.32-696.el6.x86_64.img
password centos6 #启动输入密码
 
 
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
 
 

九 如何通过密文设置加密口令

使用加密算法对口令进行加密,可以使用MD5.SHA512
明文加密
1、使用grub-md5-crypt设置密码
[root@Centos6 ~]# grub-md5-crypt
Password:
Retype password:
$1$Z.gAn/$Xd647hXfPj/sJ.i8A0By8.
 
进入/boot/grub/grub.conf文件使用vim编译器的功能
linux系统无法正常启动,故障排查恢复
输入密码和验证,即可生成一段md5加密的字符串
password --md5 $1$V1hAn/$hSLRXWfIZWwVtYz4th5rg1 
 
 
密文加密
2、使用grub-crypt及sha512进行加密
[root@Centos6 ~]# grub-crypt
Password:
Retype password:
$6$jkKAT.eUrv3d4bfM$f41lkKlqQk3fAPqNwgy93J6Wi6bVF.zB5b.24V1QPwAGXkVVmwk2MGdi1UxzStHBaPWarW20AppaOvwheNRRj.
 
修改/boot/grub/grub.conf文件
password --encrypted $6$ndPVD/LnVhjBwHaG$XlSiTmJfRJrWufrmH0tLzle/zlmCB.Zyi/WClkcL8G43NDpXlKuQPvsw4AiIJqT1fJrb2Kh8DgZLY68pIAKFI0

十 如果忘记root账号口令,如何修复?

修复方案:
可以通过救援模式删除口令
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
 
删除口令之后进入系统直接输入root用户无需密码验证就可以登录
linux系统无法正常启动,故障排查恢复
 

十一 设置grub背景图片

图片像素和格式是有要求的
使用convert工具对图片像素进行设置
首先得安装convert命令所提供的包
[root@Centos6 ~]# which convert
/usr/bin/convert
[root@Centos6 ~]# rpm -qf `which convert`
ImageMagick-6.7.2.7-6.el6.x86_64
[root@Centos6 ~]# convert -resize 640x480 -colors 14 zf.jpg zf.xpm #此命令必须在zf.jpg位置使用,使用less zf.xpm可以在头部看到相关信息
[root@Centos6 ~]# cp zf.xpm /boot/grub
[root@Centos6 grub]# vim grub.conf
splashimage=(hd0,0)/grub/zf.xpm
 
进入grub界面就能看到设置的背景图片
查看内核启动参数内核参数
[root@Centos6 ~]# cat /proc/cmdline
ro root=UUID=9ca5bdac-ce61-410e-a9fb-19a7877163cc rd_NO_LUKS rd_NO_LVM LANG=en_US.UTF-8 rd_NO_MD SYSFONT=latarcyrheb-sun16 KEYBOARDTYPE=pc KEYTABLE=us rd_NO_DM rhgb quiet
 

十二 删除grub.conf文件,启动修复

环境:/boot/grub 目录下只有stage2文件,删除原有的grub.conf文件
重启系统进入如下界面
linux系统无法正常启动,故障排查恢复
解释:stage1、stage1.5没有问题主要stage2有问题,连菜单都进不去,直接跳到grub
修复方案:
linux系统无法正常启动,故障排查恢复
grub支持交互式输入,如果没有grub.conf文件可以手动输入
 

十三 删除/boot/grub整个目录,如何修复?

[root@Centos6 ~]# rm -rf /boot/grub
 
重启进入如下界面
linux系统无法正常启动,故障排查恢复
 
修复方案:
1、进入救援模式
2、chroot /mnt/sysimage 切根
3、使用grub-install /dev/sda
4、sync同步磁盘,此时grub目录已经修复好了
linux系统无法正常启动,故障排查恢复
5、写一个grub.conf文件
因为修复时并没有grub.conf文件必须手写
linux系统无法正常启动,故障排查恢复
#必须写三项分别是title kernel initrd
default 0
timeout 3
title Centos6
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=/dev/sda2 #方便的小技巧,防止手敲出错
initrd /initramfs-2.6.32-696.el6.x86_64.img  
 
linux系统无法正常启动,故障排查恢复
linux系统无法正常启动,故障排查恢复
使用UUID也是可以的
linux系统无法正常启动,故障排查恢复
注:r!blkid|grep /dev/sda2   #UUID后面注意去掉引号
 

十四 删除/boot下所有文件如何修复?  

环境:
[root@Centos6 ~]# ls /boot
config-2.6.32-696.el6.x86_64 initramfs-2.6.32-696.el6.x86_64.img System.map-2.6.32-696.el6.x86_64
efi lost+found vmlinuz-2.6.32-696.el6.x86_64
grub symvers-2.6.32-696.el6.x86_64.gz
[root@Centos6 ~]# rm -rf /boot
rm: cannot remove `/boot': Device or resource busy
[root@Centos6 ~]# ls /boot
[root@Centos6 ~]#
修复分析:
主要修复/boot里面的内核,虚拟文件系统,grub。内核:可以在光盘里面找或者去其它相同系统的机子上拷一份
修复方案:
1、进入救援模式
2、chroot /mnt/sysimage  切根
3、挂载光盘    mount /dev/sr0  /mnt
4、cd /mnt/selinux/
vmlinuz  大小和刚开始文件系统大小是一样的,说明内核是一个固定不变的东西
5、cp vmlinuz /boot  复制内核到/boot下
6、mkinitrd /boot/initramfs.img `uname -r`
7、grub-install /dev/sda
8、在/boot/grub目录下新建一个grub.conf文件
default o
timeout 3
title Centos6
kernel  /vmlinuz ro root=/dev/sda2
initrd    /initramfs.img
9、重启恢复正常
 

十五 误删除/sbin/init,无法进入系统如何修复?

[root@Centos6 ~]# mv /sbin/init ~/
 
linux系统无法正常启动,故障排查恢复
 
恢复方案;
1、进入grub
2、按a键在后面添加 init=/bin/bash  #指定不用系统默认的init,使用/bin/bash来代替
linux系统无法正常启动,故障排查恢复
用bash来作为计算机的第一个进程,bash内置了一些内部命令
4、回车之后进入如下界面,可以输入一些命令
linux系统无法正常启动,故障排查恢复
 
5、查看/sbin/bash命令来自哪个包
bash-4.1# rpm -qf /sbin/init
#upstart包提供
 
linux系统无法正常启动,故障排查恢复
此时挂载是只读挂载,不能安装此包
 
6、重新挂载根,默认只读挂载
bash-4.1# mount -o remount,rw /
 
linux系统无法正常启动,故障排查恢复
 
7、安装upstart包
注意此时光盘已经挂载,安装包要覆盖安装,--force选项,upstart包毕竟已经安装过了
#默认光盘已经挂载在/mnt
bash-4.1# cd /mnt
bash-4.1# rpm -ivh /Packages/upstart-xxxxxx --force
 
linux系统无法正常启动,故障排查恢复
 
8、同步到磁盘
bash-4.1# sync
 
 
9、检查一下可以看到/sbin/bin
linux系统无法正常启动,故障排查恢复
总结:/sbin/bin文件误删除后,不需要进入救援模式就可以直接通过命令进行修复,过程中发现根是只读挂载的,必须重新挂载才能安装upstart包
 

十六 根文件系统放在逻辑卷上,若误操作删除/fstab,/boot/*文件该如何恢复?

[root@Centos6-LVM ~]# mv /etc/fstab /root
[root@Centos6-LVM ~]# rm -rf /boot/*
 
此时boot里面的内核文件已经删除了,所以不能通过手写恢复,只有通过救援模式
重启直接进入grub
linux系统无法正常启动,故障排查恢复
修复分析:boot分区是不能放在逻辑卷上的,那么有多快逻辑卷如何区分哪块逻辑卷是根?
恢复方案:
1、进入救援模式
2、创建一个临时目录   mkdir /mnt/tmp
3、激活逻辑卷  vgchage -ay    #当前逻辑卷状态处于非活动状态,必须激活才可以
linux系统无法正常启动,故障排查恢复
 
4、根据我的机器我从里面文件的结构和大小了解到,Vo100,Vo101app,Vo102分别为root、app、swap
5、挂载/dev/vg_centos6lvm/LogVo100到/mnt/tmp
mount /dev/vg_centos6lvm/LogVo100 /mnt/tmp
6、新建fstab文件
touch /mnt/tmp/etc/fstab
7、对fstab文件添加挂载信息
vi /mnt/tmp/etc/fstab
linux系统无法正常启动,故障排查恢复
8、重启系统,挂载一下分区,然后进入救援模式
9、切根 chroot /mnt/sysimage
到此步不能用第十四题思路对grub解题
10、重新安装内核
rpm -ivh /mnt/Packege/kernel-xxxxx.rpm --force
这里不同于“十四”,重新安装内核,“十四”是通过复制光盘的文件到/boot,重写grub.conf进行恢复
11、重写grub.conf文件
#必须写三项分别是title kernel initrd
default 0
timeout 3
title Centos6_lvm
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=/dev/vg_centos6lvm/LogVo100 selinux=0
initrd /initramfs-2.6.32-696.el6.x86_64.img
12、重启系统,恢复正常
 

十七 误删除/etc/fstab文件和/boot下的所有文件如何修复?

[root@Centos6 ~]# rm -rf /etc/fstab
[root@Centos6 ~]# rm -rf /boot
 
重启后进入如下界面
linux系统无法正常启动,故障排查恢复
修复分析:进入救援模式怎么区分/boot,/,/swap?可以通过挂载分区,进入挂载目录里面,查看内容,以区分区挂载目录
 
bash-4.1# mkdir /mnt/tmp   #创建
bash-4.1# mount /sda1 /mnt/tmp #挂载到临时文件
bash-4.1# ls /mnt/tmp #查看里面的内容,此处可以看到没有任何文件可以判断为/boot
通过以上方法就可以知道每个分区到底是什么
 
恢复方案:
1、进入救援模式
2、chroot /mnt/sysimage   #切根
3、mkdir /mnt/tmp
4、mount /dev/sda2 /mnt/tmp
5、touch /mnt/tmp/etc/fstab   #创建删除的文件
6、vi /mnt/tmp/etc/fstab  
/dev/sda1 /boot  ext4   defaults 0 0
/dev/sda2 /         ext4   defaults 0 0
/dev/sda5 swap  swap  defaults 0 0
错误一:扩展内存加上了/
linux系统无法正常启动,故障排查恢复
错误二:文件系统类型为ext4
linux系统无法正常启动,故障排查恢复
注:此处是一个大坑,稍有出错会导致在救援系统里面无法挂载光盘
7、重启系统进入救援模式
8、切根挂载光盘
chroot /mnt/sysimage/
mount /dev/cdrom /mnt
9、重新安装内核
rpm -ivh /mnt/Packege/kernel-xxxxx.rpm --force
这里不同于“十四”,重新安装内核,“十四”是通过复制光盘的文件到/boot,重写grub.conf进行恢复
10、此时/boot会生成一些新文件  (看教程使用在强制安装kernel后在做grub-instlal /dev/sda,通过我的操作过程我了解在重新安装内核会自动生成grub目录里面的内容)
11、新建grub.conf文件
#必须写三项分别是title kernel initrd
default 0
timeout 3
title Centos6
kernel /vmlinuz-2.6.32-696.el6.x86_64 ro root=/dev/sda2
initrd /initramfs-2.6.32-696.el6.x86_64.img
 

12、重启系统,恢复正常

上一篇:RPC之Thrift学习实战


下一篇:shell命令获取最新文件的名称