Oracle数据块格式

数据块结构
Oracle 数据块有三部分:
Cache layer
Transaction layer
Data layer

Oracle Data Block的结构简图如下,其中从Data header到Row Data部分合称Data Layer:


  • Cache Layer -

  • Transaction Layer -

  • Data Header -

  • Table Directory -

  • Row Directory -

  • Free Space -

  • Row Data -

  • Tailchk -

下面将使用bbed工具来显示相关结构信息

BBED> map
File: /u01/app/oracle/oradata/shardcat/users01.dbf (7)

Block: 135 Dba:0x01c00087

KTB Data Block (Table/Cluster)

struct kcbh, 20 bytes @0

struct ktbbh, 72 bytes @20

struct kdbh, 14 bytes @100

struct kdbt[1], 4 bytes @114

sb2 kdbr[8] @118

ub1 freespace[7983] @134

ub1 rowdata[71] @8117

ub4 tailchk @8188
数据块组件
Oracle数据块三层C结构,它被映射到SGA kcbh(内核缓存数据块头)中的数据块。Cache Layer包含关于块格式,类型(数据,索引,头等)信息和序列数据。

BBED> p kcbh
struct kcbh, 20 bytes @0
ub1 type_kcbh @0 0x06
ub1 frmt_kcbh @1 0xa2
ub2 wrp2_kcbh @2 0x0000
ub4 rdba_kcbh @4 0x01c00087
ub4 bas_kcbh @8 0x01286184
ub2 wrp_kcbh @12 0x0000
ub1 seq_kcbh @14 0x01
ub1 flg_kcbh @15 0x06 (KCBHFDLC, KCBHFCKV)
ub2 chkval_kcbh @16 0x0137
ub2 spare3_kcbh @18 0x0000
Cache Layer:Block的第一部分,长度为20字节,内部数据结构名为kcbh,包括
type_kcbh:块类型(table/index,rollback segment,temporary segment等)
frmt_kcbh:块格式(v6,v7,v8)
rdba_kcbh:块地址DBA
bas_kcbh/wrp_kcbh:SCN
seq_kcbh:块的序列号
flg_kcbh:块的标志

事务层存储了关于数据块的事务信息
Transaction Layer:内部结构名ktbbh。分成两部分,第一部分为固定长度,长度为24字节,包含事务相关的一些基本信息。第二部分为可变长度,包含itl,长度根据itl条目的个数变化,每个itl长度为24字节,内部结构名ktbbhitl

BBED> p ktbbh
struct ktbbh, 72 bytes @20
ub1 ktbbhtyp @20 0x01 (KDDBTDATA)
union ktbbhsid, 4 bytes @24

  ub4 ktbbhsg1                          @24       0x0001af27
  ub4 ktbbhod1                          @24       0x0001af27

struct ktbbhcsc, 8 bytes @28

  ub4 kscnbas                           @28       0x01286182
  ub2 kscnwrp                           @32       0x8000
  ub2 kscnwrp2                          @34       0x0000

sb2 ktbbhict @36 7938
ub1 ktbbhflg @38 0x32 (NONE)
ub1 ktbbhfsl @39 0x00
ub4 ktbbhfnx @40 0x01c00080
struct ktbbhitl[0], 24 bytes @44

  struct ktbitxid, 8 bytes              @44
     ub2 kxidusn                        @44       0x0006
     ub2 kxidslt                        @46       0x0012
     ub4 kxidsqn                        @48       0x000038f6
  struct ktbituba, 8 bytes              @52
     ub4 kubadba                        @52       0x010002d9
     ub2 kubaseq                        @56       0x10c9
     ub1 kubarec                        @58       0x09
  ub2 ktbitflg                          @60       0x8000 (KTBFCOM)
  union _ktbitun, 2 bytes               @62
     sb2 _ktbitfsc                      @62      -32768
     ub2 _ktbitwrp                      @62       0x8000
  ub4 ktbitbas                          @64       0x01228dbb

struct ktbbhitl[1], 24 bytes @68

  struct ktbitxid, 8 bytes              @68
     ub2 kxidusn                        @68       0x0008
     ub2 kxidslt                        @70       0x001b
     ub4 kxidsqn                        @72       0x00003a9a
  struct ktbituba, 8 bytes              @76
     ub4 kubadba                        @76       0x010002b5
     ub2 kubaseq                        @80       0x114f
     ub1 kubarec                        @82       0x20
  ub2 ktbitflg                          @84       0x2001 (KTBFUPB)
  union _ktbitun, 2 bytes               @86
     sb2 _ktbitfsc                      @86       10
     ub2 _ktbitwrp                      @86       0x000a
  ub4 ktbitbas                          @88       0x01286184

这种结构出现在数据库每个数据块的开头部分。它甚至出现在不由redo改变的排序块中。它也会出现在数据文件头块和控制文件头块的开头部分。缓存层提供了对坏数据的规模。它也用来确保正确的数据块被读取并且数据块没有破裂或损坏。所谓破裂的数据块就是只有一部分被写入磁盘,数据块的一部分保留了之前的版本。

Data Layer:包括Data Header,Table Directory,Row Directory,Free Space和Row Data。

Data Header:长度14字节,内部数据结构名kdbh

BBED> p kdbh
struct kdbh, 14 bytes @100
ub1 kdbhflag @100 0x00 (NONE)
sb1 kdbhntab @101 1
sb2 kdbhnrow @102 8
sb2 kdbhfrre @104 -1
sb2 kdbhfsbo @106 34
sb2 kdbhfseo @108 8017
sb2 kdbhavsp @110 7977
sb2 kdbhtosp @112 7989
其中kdbhnrow是存储在数据块中的记录数为8,而表中确实有8条记录。(从ROWID可以判断出来)

SQL> select dbms_rowid.rowid_block_number(rowid),t1.t_id,t1.t_name from jy.t1;

DBMS_ROWID.ROWID_BLOCK_NUMBER(ROWID) T_ID T_NAME
------------------------------------ ---------- ----------------------------------------

                             134          9 YYL
                             135          1 A
                             135          2 B
                             135          3 C
                             135          4 D
                             135          5 E
                             135          6 F
                             135          7 JYHY
                             135          8 JYYYL

9 rows selected.
Table Directory: 一般table只有一个条目,cluster则有一个或多个条目。每个条目长4字节,内部数据结构名kdbt

BBED> p kdbt
struct kdbt[0], 4 bytes @114
sb2 kdbtoffs @114 0
sb2 kdbtnrow @116 8

Row Directory:数目由块中数据的行数决定,每个条目长2字节,内部数据结构名kdbr

BBED> p kdbr
sb2 kdbr[0] @118 8080
sb2 kdbr[1] @120 8072
sb2 kdbr[2] @122 8064
sb2 kdbr[3] @124 8056
sb2 kdbr[4] @126 8048
sb2 kdbr[5] @128 8040
sb2 kdbr[6] @130 8029
sb2 kdbr[7] @132 8017
查看表中的记录数据,一个重复计数也可以被指定用来重复执行examine命令来检查后续的行记录。下面的例子显示了先使用print命令来设置最后一行记录的偏移量,然后检查后面的8行记录的操作.

BBED> p *kdbr[7]

rowdata[0]

ub1 rowdata[0] @8117 0x2c

BBED> x /8rnc

rowdata[0] @8117

flag@8117: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8118: 0x02
cols@8119: 2

col 0[2] @8120: 8
col 1[5] @8123: JYYYL

rowdata[12] @8129

flag@8129: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8130: 0x00
cols@8131: 2

col 0[2] @8132: 7
col 1[4] @8135: JYHY

rowdata[23] @8140

flag@8140: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8141: 0x00
cols@8142: 2

col 0[2] @8143: 6
col 1[1] @8146: F

rowdata[31] @8148

flag@8148: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8149: 0x00
cols@8150: 2

col 0[2] @8151: 5
col 1[1] @8154: E

rowdata[39] @8156

flag@8156: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8157: 0x00
cols@8158: 2

col 0[2] @8159: 4
col 1[1] @8162: D

rowdata[47] @8164

flag@8164: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8165: 0x00
cols@8166: 2

col 0[2] @8167: 3
col 1[1] @8170: C

rowdata[55] @8172

flag@8172: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8173: 0x00
cols@8174: 2

col 0[2] @8175: 2
col 1[1] @8178: B

rowdata[63] @8180

flag@8180: 0x2c (KDRHFL, KDRHFF, KDRHFH)
lock@8181: 0x00
cols@8182: 2

col 0[2] @8183: 1
col 1[1] @8186: A
Free Space:表示数据块中可用空间,内部数据结构名freespace

Row Data:表示实际的数据,内部数据结构名rowdata

BBED> p rowdata[0]
ub1 rowdata[0] @8117 0x2c

BBED> d /v offset 8117
File: /u01/app/oracle/oradata/shardcat/users01.dbf (7)

Block: 135 Offsets: 8117 to 8191 Dba:0x01c00087

2c020202 c109054a 5959594c 2c000202 l ,......JYYYL,...
c108044a 5948592c 000202c1 0701462c l ...JYHY,......F,
000202c1 0601452c 000202c1 0501442c l ......E,......D,
000202c1 0401432c 000202c1 0301422c l ......C,......B,
000202c1 02014101 068461 l ......A...a

<16 bytes per line>
Tailchk:保存在块结尾用于校验的数据,长度4个字节,内部结构名tailchk。所有Oracle块的最后四个字节都是tail check(结尾检查)。
对于一个Oracle 8以上版本的数据块的tail它是由SCN base的低位两字节的内容,数据块的类型与SCN序列号组成的。例如,如果SCN base为 0x01286184,数据块类型为0x06,SCN序列号为0x01,那么tail check将是0x61840601

BBED> p tailchk
ub4 tailchk @8188 0x61840601

BBED> p kcbh
struct kcbh, 20 bytes @0
ub1 type_kcbh @0 0x06
ub1 frmt_kcbh @1 0xa2
ub2 wrp2_kcbh @2 0x0000
ub4 rdba_kcbh @4 0x01c00087
ub4 bas_kcbh @8 0x01286184
ub2 wrp_kcbh @12 0x0000
ub1 seq_kcbh @14 0x01
ub1 flg_kcbh @15 0x06 (KCBHFDLC, KCBHFCKV)
ub2 chkval_kcbh @16 0x0137
ub2 spare3_kcbh @18 0x0000
虽然tail check的值通常是由这三个组件级成,Oracle会对最终的值作为一个值(4字节)以单无符号整数来存储。在小字节序编码(little-endian)的构架机器中,比如Intel,这个值将以低位字节优先的方式来存储。因此如果使用标准块编辑器或dump命令来检查数据块的tail check时,字节顺序可能不一样。一个tail check为0x61840601,在Intel机器上它将以"01068461"的形式存储在磁盘。

BBED> dump /v offset 8188
File: /u01/app/oracle/oradata/shardcat/users01.dbf (7)

Block: 135 Offsets: 8188 to 8191 Dba:0x01c00087

01068461 l ...a

<16 bytes per line>

上一篇:Oracle 12C Formatted Block Dump


下一篇:MySQL Strict SQL MODE