Oracle并行执行特性应用初探

  1. 1.     

       在历史数据转出测试过程中,通过不断的优化,包括SQL调整和数据库调整,从AWR中看到,基本上难以进行更多的性能提升,于是准备试试并行执行的特性,从这个任务的特点来分析,也比较适合采用这项技术。本文介绍了使用并行执行过程中的常用SQL,以及遇到的一些问题,以及性能对比试验的结果,并且分享了一些问题的解决经验,分析了适合并行执行的场景。

 

  1. 2.      概念及常用语法

并行执行通过充分利用硬件资源来实现特定任务的性能提升,将一个SQL语句同时分布到多个CPU上去执行,从而缩短总的耗时。

Oracle的并行执行包括:

1)        并行查询

2)        并行DML(insert,delete,update)

3)        并行DDL(表和索引的创建)。

 

为了方便参考使用,下面将收集的常用语句按并行执行的三个级别进行介绍:

对象级

设置表和索引的并行度,从而使用涉及这些对象的SQL操作按设定的并行度执行。

       例如:alter table 门诊费用记录 parallel 8;

                alter index 门诊费用记录_IX_登记时间 parallel;

   如果不指定并行度的值,Oracle会根据参数和CPU数来估算一个缺省值。

   禁用并行度(指定并行度为1或使用noparallel):

              alter table 门诊费用记录 parallel 1;

              alter index 门诊费用记录_IX_登记时间 noparallel;

如果不改变对象的并行度属性,唯一可以禁用并行查询的方法是将初始化参数parallel_max_servers设置为0。

 

会话级

人工启用和禁用的语法如下:

ALTER Session ENABLE PARALLEL query[|DML|DDL];

ALTER Session DISABLE PARALLEL query[|DML|DDL];

 

强制按指定的并行度执行。

       ALTER Session FORCE PARALLEL QUERY PARALLEL 8;

       ALTER Session FORCE PARALLEL DML PARALLEL 8;

       ALTER Session FORCE PARALLEL DDL PARALLEL 8;

      强制并行对于递归SQL不起作用,但覆盖表或索引上定义的并行度。

 

查询当前会话是否启用了并行执行:

(Oracle 10.2.0.1上,缺省启用了并行QUERY和DDL,没有启用DML)

SQL> SELECT pq_status ,pdml_status, pddl_status

        FROM v$session WHERE sid=sys_context(‘userenv‘,‘sid‘);

PQ_STATUS PDML_STATUS PDDL_STATUS

--------- ----------- -----------

ENABLED   DISABLED    ENABLED

 

语句级

通过在SQL中添加提示来指定并行执行及并行度。

       优化器只是按指定的提示来考虑是否使用并行执行,并不会强制使用(它会选择成本最低的那一个执行计划)

例如:

Select /*+ parallel(t1,8)*/count(*) from 门诊费用记录 t1;

Create table 医嘱执行时间 parallel 8 as

       select /*+ parallel(t1,8)*/* from医嘱执行时间 t1;

alter index 门诊费用记录_IX_登记时间 rebuild parallel 8;

 

注意

并行DML需要先在会话级显示的启用,并且需要同时启用并行查询;

例:

SQL>ALTER Session ENABLE PARALLEL DML;

SQL> ALTER Session ENABLE PARALLEL QUERY;

SQL> Update /*+ parallel(t1,8)*/ 门诊费用记录 t1

  Set 待转出 = 132

  Where 结帐id In

 (Select  /*+ parallel(t2,8)*/结帐id From 病人预交记录 t2 Where 待转出 = 132);

 

如果不提交事务,该会话的后续SQL无法访问被修改的表,查询未提交事务的表,将会返回错误:”ora-12838:无法读取、修改一个被并行修改过的表”

 

定义主键约束时,无法并行的自动创建主键索引,但可以采取以下变通方式:

CREATE UNIQUE INDEX 检验标本记录_UQ_标本序号

       ON 检验标本记录(核收时间, 仪器ID, 标本序号, 标本类别) PARALLEL 8;

ALTER TABLE 检验标本记录 ADD CONSTRAINT

       检验标本记录_UQ_标本序号 Unique (核收时间, 仪器ID, 标本序号, 标本类别);

这种方式创建的主键约束与自动创建的有一个差别,就是删除主键的时候,不会自动删除对应的索引,需要增加删除索引的语法,例:

ALTER TABLE 检验标本记录 drop

              CONSTRAINT 检验标本记录_UQ_标本序号 cascade drop index;

 

另外,关于并行查询的参数配置,大部分情况下,无须调整,网上的资料比较多,这里不再一一列举。仅说明一个参数:

当执行并行重建索引时,可能会遇到ora-00600错误,通过修改参数parallel_execution_message_size可解决这个问题,例:

SQL> alter system set parallel_execution_message_size=8192 scope=spfile;

缺省值为2148,对于一般的并行任务,这个值太小。

修改后需重启数据库。

 

  1. 3.      使用效果

并行查询及并行DML

 

由于所使用的历史数据转出,大部分查询均是索引范围扫描,没有全表扫描,所以,不适合并行执行。

但是,由于一次意外操作:索引压缩重建(并行DDL),执行后导致索引的属性自动加上了并行度,导致相关的SQL查询自动启用了并行查询,结果,执行计划采用了大表全表扫描,采用hash连接或嵌套连接,导致查询异常缓慢。

一些复杂的SQL执行超过了一个小时,甚至下面这种简单的SQL执行超过了5个小时仍然没有返回结果:

Update /*+ rule*/ 病人医嘱计价

  Set 待转出 = n_批次

  Where 医嘱id In (Select ID From 病人医嘱记录 Where 待转出 = n_批次);

查看执行计划,发现采用了全表扫描+嵌套连接索引的方式。

并且,提示字rule失效,优化器模式变成了CBO。最后,取消了索引的并行度,然后,重建索引,禁用了压缩特性,最终执行计划才恢复了正常。

 

因为普通的索引范围扫描并不能使用并行查询(除非是分区索引),所以,优化器会选择全表扫描方式,但是很多时候这并不是我们所期望的访问方式。

所以,并行查询和并行DML一定要慎重,否则,性能差别非常大。

 

直接路径插入

       为了快速的加载大量数据,采用直接路径插入方式可以大幅提升插入性能。

直接路径插入自动对insert 和Select操作采用了并行执行,并且目标表采用nologging最小日志模式的话,试验表明,最高可减少5倍的耗时。

       例:

Insert Into /*+ append*/H住院费用记录(ID, 记录性质, NO, ……)

  Select ID, 记录性质, NO, ……  From 住院费用记录  Where 待转出 = 132;

 

并行DDL

历史数据转出过程中,需要重建转出表上的查询所用到的索引,以便及时回收空间,加快查询速度,但这个索引重建的过程非常耗时。测试环境的配置为:32G内存、32路CPU(4*8)、Raid10的SCSI硬盘。

测试结果表明

  1. 并行DDL要50%以上。

没有并行时,重建索引需要36分钟,并行执行只需要16分钟。

  1. 并不是并行度越高就越快。

因为磁盘IO所限,该环境下并行度为8时最快

 

并行收集统计信息

        收集对象统计信息的时候,有一个参数可以指定并行度,并行的效果非常明显。试验表明,收集ZLHIS的所有对象,并行执行可以将整个时间由1个半小时缩短到30分钟左右。

 

  1. 4.      小结

       并行执行属于Oracle的OLAP应用特性之一,如果你有一些耗时很长的任务,并且服务器有大量的闲置资源(CPU,内存,IO带宽),则比较适合采用并行执行技术,它可以给你带来成倍的性能提升效果,否则,并行执行可能会由于大量的消耗资源从而影响其他人的正常使用。所以,并行执行一般情况,较少的在OLTP场合中应用,因为通常我们并不希望某一个人占用过多的系统资源。

 

  1. 5.      参考资料

1)      Oracle 性能诊断艺术.Christian Antognini.2009

2)      Oracle 性能优化求生指南.Guy Harrison .2012

 

  1. 6.      附:索引重建并行对比测试

--无并行

22:26:19 SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 2199.734 seconds

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 24;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 1450.828 seconds

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 16;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 1272.063 seconds

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 8;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

Executed in 1018.765 seconds

 

--------------------------------------------------------------

SQL> ALTER session FORCE PARALLEL DDL PARALLEL 4;

SQL> exec Zl1_Datamove_Reb(100, 1, 6);

PL/SQL procedure successfully completed

        Executed in 1125.719 seconds

Oracle并行执行特性应用初探,布布扣,bubuko.com

Oracle并行执行特性应用初探

上一篇:数据库连接池的计数器设计


下一篇:获取数据库里面最新的ID