上篇文章讲述了全扫描,这篇文章将介绍索引的结构和扫描方式,在后面将开始讲述每一种扫描方式。
当Oracle通过索引检索具体的一列或多列的列值时,就会执行索引扫描。首先我们来看看索引节点包含的数据。
索引节点包含的数据
索引可以被创建在表的单列或者多列上,索引中包含了这些列的值、rowid和一些其它信息,我们关心的只有列值和rowid。由于索引带有列值,应此如果你的SQL语句只涉及到索引的列,那么Oracle就只从索引本身检索列值,而不需要访问表。如果查询涉及到索引列以外的列,Oracle就需要使用rowid来访问表。
下面是一个rowid的例子:
AAAN0+AABAAAPIqABj
rowid中包含了文件编号、数据块编号和行号,通过下面的SQL我们可以将rowid分解为可读的具体的信息,使用先前创建的表T2:
select t.rowid, (select file_name from dba_data_files where file_id = dbms_rowid.rowid_to_absolute_fno(t.rowid, user, 'T2')) file_name, dbms_rowid.rowid_block_number(t.rowid) bokc_no, dbms_rowid.rowid_row_number(t.rowid) row_no from t2 t
执行后得到结果:
ROWID FILE_NAME BOKC_NO ROW_NO AAAN0+AABAAAPIqAAA E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 0 AAAN0+AABAAAPIqAAB E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 1 AAAN0+AABAAAPIqAAC E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 2 ...... AAAN0+AABAAAPIqAJd E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 605 AAAN0+AABAAAPIqAJe E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 606 AAAN0+AABAAAPIqAJf E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 607 AAAN0+AABAAAPIqAJg E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 608 AAAN0+AABAAAPIqAJh E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 609 AAAN0+AABAAAPIqAJi E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 610 AAAN0+AABAAAPIqAJj E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61994 611 AAAN0+AABAAAPIrAAA E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 0 AAAN0+AABAAAPIrAAB E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 1 AAAN0+AABAAAPIrAAC E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 2 AAAN0+AABAAAPIrAAD E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 3 AAAN0+AABAAAPIrAAE E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 4 ...... AAAN0+AABAAAPIrAJV E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 597 AAAN0+AABAAAPIrAJW E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 598 AAAN0+AABAAAPIrAJX E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 599 AAAN0+AABAAAPIrAJY E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 600 AAAN0+AABAAAPIrAJZ E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 601 AAAN0+AABAAAPIrAJa E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61995 602 AAAN0+AABAAAPIsAAA E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61996 0 AAAN0+AABAAAPIsAAB E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61996 1 AAAN0+AABAAAPIsAAC E:\ORACLE\ORADATA\LY\SYSTEM01.DBF 61996 2 ......
这里将得到表T2中所有行的具体位置,包括所在的文件、数据块号和块内的行号。我们可以看到数据的分布情况。
需要注意的是dbms_rowid.rowid_to_absolute_fno函数,定义如下:
function dbms_rowid.rowid_to_absolute_fno (rowid in rowid, schema_name in varchar2, object_name in varchar2) return number
1)rowid:rowid;
2)schema_name:用户名,这里是当前用户(user)
3)object_name:对象名,这里是T2
那么,通过上面的描述我们就可以得到通过索引扫描查找数据的步骤:
1)得到索引的数据块,得到索引列和rowid;
2)如果查询只涉及到索引列,则查询结束;
3)否则通过rowid找到数据块,并通过行号定位到数据。
索引结构和索引扫描类型介绍
在这里只讨论B-树索引,B-树索引是一个树状结构。表刚创建时是一个空白,对应的索引将只存在一个根节点,索引高度是1,另外索引还有一个blevel的统计信息用来表示一个索引中的分支层级数,该值为0,通过下面的查询可以得到:
select index_name,blevel from user_indexes where index_name =upper( 'index_name');
随着新的数据插入到表中,新的索引条目将被增加到块中,直到块满,这时,Oracle将会分配两个新的索引块并将索引条目加入这两个新的叶子块中,先前的索引块将变为指向新索引块的指针,这个指针包含指向新索引块的相对数据块地址(Relative Block Address,RBA)和相关叶子块中最低索引值。到这时,索引的高度将变为2,blevel值将变为1。
随着表中数据的继续增长,索引块会进一步分裂,高度会继续增长,最终形成一个树状结构:
了解了索引的结构,很容易就能理解索引扫描,索引扫描有很多种不同的类型,但都必须遍历索引结构以搜索到匹配的叶子节点。首先通过一次单块读来获取索引的根块,然后通过多次的单块读来获取路径节点的块,直到叶子节点所在的块(匹配的块),从匹配的叶子节点中获取数据的rowid,在通过rowid使用单块读获取一行数据,因此,如果索引结构的高度为4,则查询一行数据需要读取5个块,4个索引块和1个表数据块。
索引扫描类型包括:索引范围扫描、索引唯一扫描、索引全扫描、索引跳跃扫描和索引快速全扫描。在后面将详细讲述每一种扫描方式的特点和应用范围。