[No0000165]SQL 优化

2022-04-24 00:35:11

SELECT 标识选择哪些列
FROM 标示从哪个表中选择
WHERE 过滤条件
GROUP BY 按字段数据分组
HAVING 字句过滤分组结果集
ORDER BY 序按字段排序 ASC( 默认) 序升序 DESC 降序
备注：尽量避免使用select * from TAB, 按需选取需要的字段

使用*, 在解析的过程中会将* 依次转换成所有的列名, 这个工作是通过
查询数据字典完成的, 这意味着将耗费更多的时

Oracle 表访问方式

• 全表扫描

1、Oracle读取表中所有的行，并检查每一行是否满足语句的WHERE限制条件。
2、非常消耗IO,CPU,内存资源，是我们尽量避免的一种方式

• 索引扫描

1、先通过index查找到数据对应的rowid值(对于非唯一索引可能返回多个rowid值)，然后根据rowid直接从表中得到具体的数据，这种查找方式称为索引扫描或索引查找。
2、一般查取的数据量小于表里数据总量的 5%-10%时，建议采用索扫描。

Oracle多表连接方式

• Inner join(内连接)两边表同时符合条件的组合，只返回两表相匹配的数据。

• left join (左连接)显示符合条件的数据行，左表返回所有数据，右表中只返回与左表匹配的数据, 右边没有对应的条目显示NULL。

• right join(右连接)显示符合条件的数据行，右表返回所有数据，左表只返回与右表匹配的数据，左边没有对应的条目显示NULL。

• full join (全连接)显示符合条件的数据行，同时显示左右不符合条件的数据行，相应的左右两边显示NULL，即显示左连接、右连接和内连接的并集

inner join的方式: /*只返回两表相匹配的数据，显示左表的3、4和右表的 3，4 ,左表的1、2和右表的5、6都没有显示*/

SQL> SELECT L.str AS LEFT_str,R.str ASRIGHT_str FROM L INNER JOIN R ON L.v = R.v ORDER BY 1,2;

LEFT_S ASRIGHT

------ -------

left_3 right_3

left_4 right_4                                                                                                              

left join的方式:/*左表返回所有数据，右表中只返回与左表匹配的数据,右表5、6都没有显示并且与左表1、2对应的条目显示为null*/     

SQL> SELECT L.str AS LEFT_str,R.str ASRIGHT_str FROM L LEFT JOIN R ON L.v = R.v ORDER BY 1,2;

LEFT_S ASRIGHT

------ -------

left_1

left_2

left_3 right_3

left_4 right_4                                                                                                              

right join的方式:/*左表只返回与右表匹配的数据3、4，右表返回所有数据，左表 1、2都没有显示且与右表5、6对应没有条目的显示null*/

SQL> SELECT L.str AS LEFT_str,R.str ASRIGHT_str FROM L RIGHT JOIN R ON L.v = R.v ORDER BY 1,2;

LEFT_S ASRIGHT

------ -------

left_3 right_3

left_4 right_4

       right_5

       right_6                                                                                                              

full join的方式:/*左右表均返回所有数据，但只有相匹配的数据显示在同一行，非匹配的行只显示一个表的数据*/

SQL> SELECT L.str AS LEFT_str,R.str ASRIGHT_str FROM L FULL JOIN R ON R.v = L.v ORDER BY 1,2;

LEFT_S ASRIGHT

------ -------

left_1

left_2

left_3 right_3

left_4 right_4

       right_5

       right_6

标量子查询

select tab.owner, (select object_type from obj where tab.table_name=obj.object_name)
from tab where tab.status='VALID';

标量子查询的原理:
(1).主查询返回多少行，标量子查询就被扫描多少次，如果返回的记录数很少的时候sql性能影响的不是很大。
(2).如果主查询返回的结果集比较的大话，性能会有严重的影响，我们可以在业务容许的情况下，让返回的结果集尽量的少（加过滤条件）或者我们考虑减少子查询访问的体积，例如在合适的字段上面建立索引。
(3).如果还不能解决问题，最好就是要改写了，使用join的方式将子查询改写到语句的from后面。

SQL> select /*+ gather_plan_statistics */ tab.owner, (select object_type from obj where tab.table_name=obj.object_name) from tab where tab.status='VALID';

SQL> select * from table(dbms_xplan.display_cursor(null,null,'advanced allstats last'));

Predicate Information (identified by operation id):
---------------------------------------------------
1 - filter("OBJ"."OBJECT_NAME"=:B1)
2 - filter("TAB"."STATUS"='VALID')

可以看到 tab执行一次全表扫描，获取 203行数据，然后 203条数据，每一条去和 obj表进行一次查询，obj表被查询 203次，发生了 203次全表扫描，性能非常低下。

标量子查询改写

SQL> select /*+ gather_plan_statistics */ tab.owner, obj.object_type from tab left join obj on tab.table_name=obj.object_name and tab.status='VALID';
SQL> select * from table(dbms_xplan.display_cursor(null,null,'advanced allstats last'));

Predicate Information (identified by operation id):
---------------------------------------------------
1 - access("TAB"."TABLE_NAME"="OBJ"."OBJECT_NAME" AND "TAB"."STATUS"=CASE WHEN ("OBJ"."OBJECT_NAME" IS NOT NULL) THEN 'VALID' ELSE 'VALID' END )
可以看到 tab，obj 表各执行一次全表扫描，获取数据后进行HASH JOIN ，性能比标量子查询效率高。

Oracle不能使用索引的情况

Where列上使用函数导致索引失效

避免对条件列使用函数
SQL> select count(*) from newsadmin.ann_basinfo t where to_char(eutime,‘yyyy-mm-dd’)=‘2018-06-20’ ;

SQL> select count(*) from newsadmin.ann_basinfo t where eutime=to_date('2018-06-20‘,’yyyy-mm-dd’);

在对条件列上使用函数运算时，无法使用到列上的索引，导致使用不好的执行计划，性能下降。

Where 列上带有运算符

避免对条件列进行运算
SQL> select object_name from my_object where object_id -100 = 10086 ;

SQL> select object_name from my_object where object_id=10086+100;

在对条件列上进行运算时，无法使用到列上的索引，导致使用不好的执行计划，性能下降。

Where 列上存在隐式类型转换

避免条件列产生隐式类型转化

SQL> select * from my_object where OBJECT_ID_1=10086;

* 1 - filter(TO_NUMBER("OBJECT_ID_1")=10086)
SQL> select * from my_object where OBJECT_ID_1='10086';

* 2 - access("OBJECT_ID_1"='10086')

列类型隐式转换其他问题案例

截取一段 5.24日 EMBASERACPDG05 库系统负载图

抓取到其中一条SQL 如下：

    SELECT ROWNUM ID,

          A.CDSY_SECUCODE_EID,

          SPTM_MARKETRELATION_EID,

          B.EID LICO_FN_FCRGCASHS_EID,

          A1.CDSY_KP_PUBLISHSTOCK_EID,

          A1.CDSY_KP_PUBLISHRELATION_EID,

          A.MSECUCODE SECURITYCODE,

          A.SECURITYCODE STR_SECURITYCODE_HIDE,

          SECURITYSHORTNAME,

          TO_CHAR(B.REPORTDATE, 'YYYY') STR_BAOGAOQI,

          B.REPORTDATE DAT_REPORTDATE_HIDE,

          CASE

            WHEN TO_CHAR(B.REPORTDATE, 'MM') = '' THEN

             '年报'

            WHEN TO_CHAR(B.REPORTDATE, 'MM') = '' THEN

             '半年报'

            WHEN TO_CHAR(B.REPORTDATE, 'MM') = '' THEN

             '一季报'

            WHEN TO_CHAR(B.REPORTDATE, 'MM') = '' THEN

             '三季报'

          END STR_BAOGAORIQILEIXING,

          ROUND(B.NETOPERATECASHFLOW_S / 10000, 15) DEC_BENQIJINGYING,

          ROUND(C.NETOPERATECASHFLOW_S / 10000, 15) DEC_SHANGQIJINGYING,

          CASE

            WHEN NVL(NVL(B.NETOPERATECASHFLOW_S, 0) -

                     NVL(C.NETOPERATECASHFLOW_S, 0),

                     0) = 0 OR NVL(C.NETOPERATECASHFLOW_S, 0) = 0 THEN

             0

            ELSE

             ROUND((NVL(B.NETOPERATECASHFLOW_S, 0) -

                   NVL(C.NETOPERATECASHFLOW_S, 0)) /

                   ABS(C.NETOPERATECASHFLOW_S) * 100,

                   15)

          END DEC_JINGYINGZENGZHANG,

          ROUND(B.NETINVCASHFLOW_S / 10000, 15) DEC_BENQITOUZI,

          ROUND(C.NETINVCASHFLOW_S / 10000, 15) DEC_SHANGQITOUZI,

          CASE

            WHEN NVL(NVL(B.NETINVCASHFLOW_S, 0) - NVL(C.NETINVCASHFLOW_S, 0),

                     0) = 0 OR NVL(C.NETINVCASHFLOW_S, 0) = 0 THEN

             0

            ELSE

             ROUND((NVL(B.NETINVCASHFLOW_S, 0) - NVL(C.NETINVCASHFLOW_S, 0)) /

                   ABS(C.NETINVCASHFLOW_S) * 100,

                   15)

          END DEC_TOUZIZENGZHANG,

          ROUND(B.NETFINACASHFLOW_S / 10000, 15) DEC_BENQICHOUZI,

          ROUND(C.NETFINACASHFLOW_S / 10000, 15) DEC_SHANGQICHOUZI,

          CASE

            WHEN NVL(NVL(B.NETFINACASHFLOW_S, 0) -

                     NVL(C.NETFINACASHFLOW_S, 0),

                     0) = 0 OR NVL(C.NETFINACASHFLOW_S, 0) = 0 THEN

             0

            ELSE

             ROUND((NVL(B.NETFINACASHFLOW_S, 0) -

                   NVL(C.NETFINACASHFLOW_S, 0)) / ABS(C.NETFINACASHFLOW_S) * 100,

                   15)

          END DEC_CHOUZIZENGZHANG,

          ROUND(B.NICASHEQUI_S / 10000, 15) DEC_BENQIXIANJIN,

          ROUND(C.NICASHEQUI_S / 10000, 15) DEC_SHANGQIXIANJIN,

          CASE

            WHEN NVL(NVL(B.NICASHEQUI_S, 0) - NVL(C.NICASHEQUI_S, 0), 0) = 0 OR

                 NVL(C.NICASHEQUI_S, 0) = 0 THEN

             0

            ELSE

             ROUND((B.NICASHEQUI_S - C.NICASHEQUI_S) / ABS(C.NICASHEQUI_S) * 100,

                   15)

          END DEC_XIANJINZENGZHANG,

          SUBSTR(STR_PUBLISHCODEZJH, 1, 6) STR_PUBLISHCODEZJH,

          (SELECT XX1.PUBLISHNAME

             FROM NEWSADMIN.CDSY_KP_PUBLISHRELATION XX1

            WHERE XX1.PUBLISHCODE = SUBSTR(STR_PUBLISHCODEZJH, 1, 6)

              AND XX1.PUBLISHCODE LIKE '002%'

              AND XX1.EISDEL = 0) AS STR_PUBLISHNAMEZJH,

          SUBSTR(STR_PUBLISHCODEDC1, 1, 12) AS STR_PUBLISHCODEDC3,

          (SELECT XX1.PUBLISHNAME

             FROM NEWSADMIN.CDSY_KP_PUBLISHRELATION XX1

            WHERE XX1.PUBLISHCODE = SUBSTR(STR_PUBLISHCODEDC1, 1, 12)

              AND XX1.PUBLISHCODE LIKE '004%'

              AND XX1.EISDEL = 0) AS STR_PUBLISHNAMEDC3

     FROM (SELECT A.EID CDSY_SECUCODE_EID,

                  B.EID SPTM_MARKETRELATION_EID,

                  A.SECURITYCODE || B.MARKETRELEATION MSECUCODE,

                  A.SECURITYCODE,

                  A.SECURITYSHORTNAME,

                  TO_CHAR(A.COMPANYCODE)COMPANYCODE

             FROM NEWSADMIN.CDSY_SECUCODE A

             JOIN NEWSADMIN.SPTM_MARKETRELATION B

               ON A.TRADEMARKETCODE = B.MARKETCODE

            WHERE A.EISDEL = 0

              AND B.EISDEL = 0

              AND (A.SECURITYTYPE = 'A股' OR A.SECURITYTYPE = 'B股' OR

                  A.SECURITYTYPE = '三板股')) A

     JOIN (SELECT EID,

                  COMPANYCODE,

                  REPORTDATE,

                  NETOPERATECASHFLOW_S,

                  NETINVCASHFLOW_S,

                  NETFINACASHFLOW_S,

                  NICASHEQUI_S,

                  DATAAJUSTTYPE

             FROM NEWSADMIN.LICO_FN_FCRGCASHS

            WHERE EISDEL = 0

              AND COMBINETYPECODE = 001

              AND DATAAJUSTTYPE = '') B

       ON A.COMPANYCODE = B.COMPANYCODE

     LEFT JOIN (SELECT COMPANYCODE,

                       REPORTDATE,

                       NETOPERATECASHFLOW_S,

                       NETINVCASHFLOW_S,

                       NETFINACASHFLOW_S,

                       NICASHEQUI_S,

                       DATAAJUSTTYPE

                  FROM NEWSADMIN.LICO_FN_FCRGCASHS a

                 WHERE COMBINETYPECODE = 001

                   AND DATAAJUSTTYPE = '') C

       ON B.COMPANYCODE = C.COMPANYCODE

      AND TO_CHAR(B.REPORTDATE, 'YYYY') - 1 = TO_CHAR(C.REPORTDATE, 'YYYY')

      AND TO_CHAR(B.REPORTDATE, 'MM-DD') = TO_CHAR(C.REPORTDATE, 'MM-DD')

     LEFT JOIN (SELECT B.EID         CDSY_KP_PUBLISHSTOCK_EID,

                       C.EID         CDSY_KP_PUBLISHRELATION_EID,

                       SECURITYCODE,

                       COMPANYCODE,

                       C.PUBLISHCODE AS STR_PUBLISHCODEZJH

                  FROM NEWSADMIN.CDSY_KP_PUBLISHSTOCK B

                  JOIN NEWSADMIN.CDSY_KP_PUBLISHRELATION C

                    ON C.PUBLISHCODE = B.PUBLISHCODE

                 WHERE C.PUBLISHCODE LIKE '002%' --证监会行业

                   AND B.EISDEL = 0

                   AND C.EISDEL = 0) A1

       ON A1.SECURITYCODE = A.SECURITYCODE

      AND A1.COMPANYCODE = A.COMPANYCODE

     LEFT JOIN (SELECT SECURITYCODE,

                       COMPANYCODE,

                       C.PUBLISHCODE AS STR_PUBLISHCODEDC1

                  FROM NEWSADMIN.CDSY_KP_PUBLISHSTOCK B

                  JOIN NEWSADMIN.CDSY_KP_PUBLISHRELATION C

                    ON C.PUBLISHCODE = B.PUBLISHCODE

                 WHERE C.PUBLISHCODE LIKE '004%' --东财行业

                   AND B.EISDEL = 0

                   AND C.EISDEL = 0) A2

       ON A2.SECURITYCODE = A.SECURITYCODE

      AND A2.COMPANYCODE = A.COMPANYCODE

   --WHERE A.SECURITYCODE='000012'

   --AND TO_CHAR(B.REPORTDATE,'YYYY-MM-DD')='2010-12-31'

其中字段 COMBINETYPECODE 是varchar2 类型，SQL 中给了一个number ,导致SQL 走错执行计划，修改后原来跑 50分钟的，后来只跑了 5分钟。

Where 列上 Like ‘%XX’ 形式的查询

列上 Like ‘%XX’ 形式
SQL> select * from my_objects where object_name like '%FUND%';

SQL> select * from my_objects where object_name like 'FUND%';

在对条件列上进行%在前过滤时，无法使用到列上的索引，导致使用不好的执行计划，性能下降。

Where 列上使用 <>

避免对条件列使用<>
SQL> select * from my_objects where object_name <> 'FUND';

SQL> select * from my_objects where object_name = 'FUND';

在对条件列上进行运算时，无法使用到列上的索引，导致使用不好的执行计划，性能下降。
优化 != , 可以通过建 decode(object_name,’FUND’,null,1) 函数索引优化

Where 列上使用 is null

避免对条件列is null
SQL> select * from my_objects where object_name is null;

优化1：

create index inx_object_name1 on my_objects(object_name,1);
select * from my_objects where object_name is null;

优化2：
create index inx_object_name on my_objects(decode(object_name,null,1,2));
select * from my_objects where decode(object_name,null,1,2) =1；

在对条件列使用is null ，无法使用到列上的索引，导致使用不好的执行计划，性能下降。

Oracle 其他优化技巧

UNION ALL 代替 OR

SQL> select owner, object_name, object_type from my_object t where t.object_id=1000 or t.object_type='INDEX';

SQL> select owner, object_name, object_type from my_object t where t.object_id=1000
union all
3 select owner, object_name, object_type from my_object t where t.object_type='INDEX';

Object_id, object_type 列上都存在索引，使用OR 时全表扫描，性能较差，修改UNION ALL 后全部使用到索引，提升性能。

select (列名) 代替 select *

SQL> select /*+ gather_plan_statistics */ object_id from my_object where TEMPORARY='YES';

no rows selected
SQL> select * from table(dbms_xplan.display_cursor(null,null,'advanced allstats last'));

SQL> select /*+ gather_plan_statistics */ * from my_object where TEMPORARY='YES';

no rows selected
SQL> select * from table(dbms_xplan.display_cursor(null,null,'advanced allstats last'));

同样是没有查询到数据， select 列需要消耗 353k 内存资源， select * 则消耗了 4.9M 内存资源，在内存资源，IO 资源，及网络流量上 select * 都要昂贵的多，所以不要轻易写 select * 在 SQL 语句中。

减少不必要的排序

SQL> select count(*) from (select * from my_object order by object_name) t;

SQL> select count(*) from (select * from my_object ) t;

Order by 在此处就是不必要的，添加后产生了一次排序操作，消耗了14M 的排序空间，消耗了大量的内存和CPU资源，性能非常差。

巧用CASE .. WHEN 用法

-----性能低下的写法

SQL> SELECT EID, LISTAGG(NAME, ',') WITHIN GROUP(ORDER BY EID) 发放日1

FROM (SELECT EID, '现金:' || TO_CHAR(CASHDATE, 'YYYY-MM-DD') NAME

FROM NEWSADMIN.HK_HOLDER_DIVIDEND

WHERE CASHDATE IS NOT NULL

UNION ALL

SELECT EID, '送股:' || TO_CHAR(SENDSHAREDATE, 'YYYY-MM-DD') NAME

FROM NEWSADMIN.HK_HOLDER_DIVIDEND

WHERE SENDSHAREDATE IS NOT NULL)

GROUP BY EID;

执行计划：

这条语句中对表NEWSADMIN.HK_HOLDER_DIVIDEND 全表扫描了 2次，看看这个如何用 case when 优化？

SQL>SELECT EID,

             CASE

                WHEN SENDSHAREDATE IS NOT NULL THEN

                 '送股:' || TO_CHAR(SENDSHAREDATE, 'YYYY-MM-DD') || ','

             END || CASE

                WHEN CASHDATE IS NOT NULL THEN

                 '现金:' || TO_CHAR(CASHDATE, 'YYYY-MM-DD')

             END RELEASDATE1

    FROM NEWSADMIN.HK_HOLDER_DIVIDEND

 WHERE CASHDATE IS NOT NULL

        OR SENDSHAREDATE IS NOT NULL;

执行计划：

通过改写 NEWSADMIN.HK_HOLDER_DIVIDEND 这张表2次全表扫描是不是就变成 1次了，执行效率大大提高。

CLOB,NCLOB等大字段要求

1、大字段尽量不要出现在 select 列表里，如果一定要出现，可以使用dbms_lob.substr(XXX,2000,1)取特定长度查询。
2、大字段尽量不要出现在 where 列条件里，对大字段做条件判断性非常低下。
3、大字段尽量不要出现在 JOIN 关联列里，性能低下不说，且毫无意义。
4、大字段的设计优化，可以考虑从2个方面考虑：
1）可以设计一张子表主要用于存放大字段数据，当主表中需要查询大字段时，通过主表与子表关联的方式查询，在多数情况下我们只需要查询主表信息，而并不需要查询大字段。
2）彻底将大字段列从数据库中分离出去，单独存放在共享文件服务器上，表中大字段列只存放指向文件服务器的一个路径，当需要读取大字段内容时，通过链接到文件服务器上打开文件。
这样设计从性能上，提高我们主表查询效率，从容量上同样减轻数据库的负担。

限制条件推入

SQL> select t.* from (select t.companycode, t.eid, t.eitime , rownum from newsadmin.balance_l t where t.eisdel ='4') t where t.eid=120000001555720986;

优化： rownum 放在外层。
SQL> select t.*，rownum from (select t.companycode, t.eid, t.eitime from newsadmin.balance_l t where t.eisdel ='4') t where t.eid=120000001555720986;

Predicate Information (identified by operation id):

------------------------------------------
* 1 - filter("T"."EISDEL"='4')
* 2 - access("T"."EID"=120000001555720986)

ROWNUM 放外层后， t.eid=120000001555720986 的条件成功带入里层进行过滤，并且使用到索引，性能高效。

有主键，count(主键)比count(1)快；

无主键，count(1)比count(列名)快；

表有多个列且无主键，count(1)优于count(*);

表只有一个字段，count(*)最优；

码农公寓