在做项目的过程中,一个页面使用类似如下的SQL查询数据,为了保密和使用方便,我把项目中有关的表名和字段替换使用ORACLE数据库中的系统表和字段。
在我所做的项目中,类似ALL_TABLES的表中大概有8W多条数据,下面这个查询SQL很慢。
WITH PARAMS AS (SELECT '' USER_ID, '' SDATE, '%' || '' || '%' SNAME FROM DUAL) SELECT AU.USERNAME, AU.USER_ID FROM ALL_USERS AU INNER JOIN PARAMS PA ON 1 = 1 INNER JOIN DBA_USERS DU ON AU.USERNAME = DU.USERNAME WHERE ((PA.SDATE IS NULL AND PA.USER_ID IS NOT NULL AND AU.USER_ID = PA.USER_ID) OR (PA.SDATE IS NULL AND PA.USER_ID IS NULL AND AU.USERNAME NOT IN (SELECT AU.USERNAME FROM ALL_USERS AU INNER JOIN DBA_USERS DEV ON AU.USERNAME = DEV.USERNAME INNER JOIN (SELECT OWNER AS USERNAME FROM ALL_TABLES T WHERE T.LAST_ANALYZED = TRUNC(SYSDATE)) ATA ON AU.USERNAME = ATA.USERNAME)) OR (PA.SDATE IS NOT NULL AND AU.USERNAME IN (SELECT AU.USERNAME FROM ALL_USERS AU INNER JOIN DBA_USERS PA ON AU.USERNAME = PA.USERNAME INNER JOIN ALL_TABLES ATA ON PA.USERNAME = ATA.OWNER WHERE TO_CHAR(ATA.LAST_ANALYZED, 'YYYY-MM-DD') = PA.SDATE) AND AU.USER_ID = PA.USER_ID)) AND DU.PROFILE LIKE 'D%' AND AU.USERNAME LIKE PA.SNAME
针对上面的SQL语句执行慢的问题,我做了如下的分析:
第一步,把语句的WHERE条件后的三个OR都分别和主查询一块执行,执行速度都很快,放到一块就很慢。
第二步,对比上面SQL和三个OR拆分出来的三个SQL的执行计划,如下图所示。发现上面SQL的执行中有一个FILTER,过滤器谓词中用到了NOT EXISTS,是导致这条SQL跑的慢的原因。
原因找到了,就得想办法把执行计划的FILTER去掉。开始想加HINT,但是实验了很多HINT,都不起作用。最后的结果还一样,后来想到WITH AS 能提高SQL的查询速度,就把影响SQL执行的那段SQL放到WITH AS里面,结果还是一样。后来尝试把HINT MATERIALIZE和WITH AS 结合使用,修改成如下的SQL,查询速度立即提升了很多。如下图所示,执行计划中FILTER的NOT EXISTS不存在了。
WITH PARAMS AS (SELECT '' USER_ID, '' SDATE, '%' || '' || '%' SNAME FROM DUAL), USERNAMEDATA AS (SELECT /*+ materialize */ AU.USERNAME FROM ALL_USERS AU INNER JOIN DBA_USERS DEV ON AU.USERNAME = DEV.USERNAME INNER JOIN (SELECT OWNER AS USERNAME FROM ALL_TABLES T WHERE T.LAST_ANALYZED = TRUNC(SYSDATE)) ATA ON AU.USERNAME = ATA.USERNAME) SELECT AU.USERNAME, AU.USER_ID FROM ALL_USERS AU INNER JOIN PARAMS PA ON 1 = 1 INNER JOIN DBA_USERS DU ON AU.USERNAME = DU.USERNAME WHERE ((PA.SDATE IS NULL AND PA.USER_ID IS NOT NULL AND AU.USER_ID = PA.USER_ID) OR (PA.SDATE IS NULL AND PA.USER_ID IS NULL AND AU.USERNAME NOT IN (SELECT USERNAME FROM USERNAMEDATA)) OR (PA.SDATE IS NOT NULL AND AU.USERNAME IN (SELECT AU.USERNAME FROM ALL_USERS AU INNER JOIN DBA_USERS PA ON AU.USERNAME = PA.USERNAME INNER JOIN ALL_TABLES ATA ON PA.USERNAME = ATA.OWNER WHERE TO_CHAR(ATA.LAST_ANALYZED, 'YYYY-MM-DD') = PA.SDATE) AND AU.USER_ID = PA.USER_ID)) AND DU.PROFILE LIKE 'D%' AND AU.USERNAME LIKE PA.SNAME
总结:
在FILTER中,NOT EXISTS后的SQL语句多次执行,本来数据量就很大,每次都要执行一遍,结果可想而知。但是使用HINT MATERIALIZE和WITH AS 结合使用,把内联视图实体化,执行过程中会创建基于视图的临时表。这样就不会每次NOT EXISTS都去执行一遍大数据表的扫描,只需要扫描一次即可。
但是是不是可以在WITHAS中的每个语句都实体化那?如果WITH AS中的语句只被调用一次的话,最好还是不要使用HINT MATERIALIZE,因为使用HINT MATERIALIZE第一次查询会创建基于视图结果的临时表,这也耗费一些时间。多次使用的话可以使用HINT MATERIALIZE。
ORACLE使用WITH AS和HINT MATERIALIZE优化SQL解决FILTER效率低下,布布扣,bubuko.com