原创 | SQL优化之索引的那些事儿

1. 聚集索引和非聚集索引


索引一般分为聚集索引和非聚集索引。

聚集索引速度很快,但只能建一个,所以尽量把经常使用的列建成聚集索引。

非聚集索引虽然没聚集索引快,但是可以建多个,比全表扫描快。



2

 如何建立高效的索引


A.关联条件上建立索引

例如:SELECT  * FROM  T1JOIN  T2 ON  T1.ORDER_ID=T2.ORDER_ID;在关联条件ON后面的两个列就可以分别建立索引,这样会很快将符合关联条件的数据查询出来。B.在条件查询上建立索引例如:SELECT * FROM T1 WHERE  T1.PRICE>20;在WHERE条件PRICE列上就可以建立索引。注意:以下几种情况不会使用索引

  • 在索引列上使用了运算符的,例如:T1.PRICE*0.5>20,这种不会使用索引
  • 在索引列上使用了函数的,例如:UPPER(T1.ADDRESS)='NEWYORK',也不会使用索引
  • 在使用索引时存在空值NULL的,例如:T1.ADDRESS IS NULL,那么在查询时就不会走索引了
  • 字符型数据不加引号也不会使用索引例如:ORDER_ID原本是字符型,T1.ORDER_ID='112'会使用索引,但是如果去掉引号,变成了T1.ORDER_ID=112,查询语句不会报错,但是不会使用索引了。
  • 或(OR)和不等(<>,!=)以及NOT IN等这些也不会使用索引
  • 经常使用的LIKE,除了前置匹配,其他匹配均不走索引例如:T1.ADDRESS LIKE ‘NEW%’,这个走索引,但是像T1.ADDRESS LIKE ‘%NEW%’和T1.ADDRESS LIKE ‘%NEW’则均不走索引了
  • 最后如果查询优化器判断全表扫描比走索引还快也不会使用到索引。

C.建立索引的原则

  • 不频繁写入和更新的列适合建立索引
  • 经常查询的列适合建立索引
  • 重复数据较少的可以建立索引

D.联合索引的妙用联合索引就是几个列合在一起组成一个索引,这种在WHERE条件中相比单列索引会起到意想不到效果。例如:SELECT * FROM T1 WHERE T1.CITY=‘北京’ AND T1.DISTR='海淀区';这个时候将列CITY和DISTR建立成一个联合索引,效果会更好。注意:联合索引需要按顺序走,如果中间某个索引不能使用,那它之后的列均不会使用索引。例如:SELECT * FROM T1 WHERE T1.CITY=‘北京’AND LEFT(T1.DISTR,3)='海淀区' AND T1.ROAD='#10'如果我们将CITY,DISTR,ROAD建立成为联合索引,由于索引的前置规则,只会让CITY走索引,后面的DISTR因为使用了函数,索引失效,最后的ROAD列因为DISTR的失效也会跟着失效,这里记住即可。



3

什么情况不适合建立索引


由于创建索引和维护索引耗时,时间随着数据的增加而增加,成正比;需要占物理空间;当对表中的数据进行维护时,对索引也要进行维护,这样就降低了数据的维护速度。基于这些缺点,以下情况不适合建立索引

  • 对于在查询过程中很少使用或参考的列,不应该创建索引。
  • 对于那些只有很少数据值的列,不应该创建索引,例如:性别。
  • 对于那些定义为image,text和bit数据类型的列,不应该创建索引。
  • 当修改性能远大于检索性能,不应该建立索引。
  • 重复值较多的也不适合建立索引。


上一篇:《大数据架构和算法实现之路:电商系统的技术实战》——第2章 方案设计和技术选型:聚类 2.1 聚类的基本概念


下一篇:Git异常:fatal: could not create work tree dir 'XXX': No such file or directory