利用kfed的repair命令修复asm头块,碰到这个错误。
错误信息如下:
$kfed repair /dev/rhdisk3
KFED-00320: Invalid block num1 = [3], num2 = [1], error = [type_kfbh]
导致这个错误的原因是由于当前磁盘组的AUSIZE不是默认值1M,而是4M。
对于磁盘组的头块损坏,不知道具体AUSIZE的值的情况,有两个方法,一是通过ASM的告警日志文件,找磁盘组创建时的参数信息:
SUCCESS: create diskgroup oradata external redundancy disk
'/dev/rhdisk3',
'/dev/rhdisk4',
'/dev/rhdisk5',
'/dev/rhdisk6',
.
.
.
'/dev/rhdisk31',
'/dev/rhdisk32'
attribute 'au_size'='4M',
'compatible.asm'='11.2',
'compatible.rdbms'='11.2'
NOTE: diskgroup resource ora.ORADATA.dg is online
另一个方法是直接查看备份块信息。由于不同AUSIZE的值,备份块位置不同,不过通过几次尝试就肯定可以找到,备份块的位置是POWER(2, N) – 2,对于4M的AUSIZE,则备份块的位置2046:
$kfed read /dev/rhdisk3 blkn=2046|more
kfbh.endian: 0 ; 0x000: 0x00
kfbh.hard: 130 ; 0x001: 0x82
kfbh.type: 1 ; 0x002: KFBTYP_DISKHEAD
kfbh.datfmt: 1 ; 0x003: 0x01
kfbh.block.blk: 1022 ; 0x004: blk=1022
kfbh.block.obj: 2147483648 ; 0x008: disk=0
kfbh.check: 2398806058 ; 0x00c: 0x8efae02a
kfbh.fcn.base: 0 ; 0x010: 0x00000000
kfbh.fcn.wrap: 0 ; 0x014: 0x00000000
kfbh.spare1: 0 ; 0x018: 0x00000000
kfbh.spare2: 0 ; 0x01c: 0x00000000
kfdhdb.driver.provstr: ORCLDISK ; 0x000: length=8
kfdhdb.driver.reserved[0]: 0 ; 0x008: 0x00000000
kfdhdb.driver.reserved[1]: 0 ; 0x00c: 0x00000000
kfdhdb.driver.reserved[2]: 0 ; 0x010: 0x00000000
kfdhdb.driver.reserved[3]: 0 ; 0x014: 0x00000000
kfdhdb.driver.reserved[4]: 0 ; 0x018: 0x00000000
kfdhdb.driver.reserved[5]: 0 ; 0x01c: 0x00000000
kfdhdb.compat: 186646528 ; 0x020: 0x0b200000
kfdhdb.dsknum: 0 ; 0x024: 0x0000
kfdhdb.grptyp: 1 ; 0x026: KFDGTP_EXTERNAL
kfdhdb.hdrsts: 3 ; 0x027: KFDHDR_MEMBER
kfdhdb.dskname: ORADATA_0000 ; 0x028: length=12
kfdhdb.grpname: ORADATA ; 0x048: length=7
kfdhdb.fgname: ORADATA_0000 ; 0x068: length=12
kfdhdb.capname: ; 0x088: length=0
kfdhdb.crestmp.hi: 32970512 ; 0x0a8: HOUR=0x10 DAYS=0x18 MNTH=0x5 YEAR=0x7dc
kfdhdb.crestmp.lo: 941082624 ; 0x0ac: USEC=0x0 MSEC=0x1f2 SECS=0x1 MINS=0xe
kfdhdb.mntstmp.hi: 32971030 ; 0x0b0: HOUR=0x16 DAYS=0x8 MNTH=0x6 YEAR=0x7dc
kfdhdb.mntstmp.lo: 97022976 ; 0x0b4: USEC=0x0 MSEC=0x21d SECS=0x1c MINS=0x1
kfdhdb.secsize: 512 ; 0x0b8: 0x0200
kfdhdb.blksize: 4096 ; 0x0ba: 0x1000
kfdhdb.ausize: 4194304 ; 0x0bc: 0x00400000
kfdhdb.mfact: 454272 ; 0x0c0: 0x0006ee80
kfdhdb.dsksize: 51200 ; 0x0c4: 0x0000c800
kfdhdb.pmcnt: 2 ; 0x0c8: 0x00000002
kfdhdb.fstlocn: 1 ; 0x0cc: 0x00000001
kfdhdb.altlocn: 2 ; 0x0d0: 0x00000002
kfdhdb.f1b1locn: 2 ; 0x0d4: 0x00000002
kfdhdb.redomirrors[0]: 0 ; 0x0d8: 0x0000
kfdhdb.redomirrors[1]: 0 ; 0x0da: 0x0000
如果找遍ASM都无法找到备份头块,那么你的版本是10.2.0.4及以下版本,Oracle没有在ASM保存头块的备份。KFED的REPAIR功能是11g才提供的,因此你根本不会碰到文章里面提到的错误,不过坏消息是没有一个简单的办法来恢复ASM磁盘头了。
确定ASM的AUSIZE后,通过下面的命令修复ASM:
$kfed repair /dev/rhdisk3 aus=4194304