我们先回顾一下之前的MySQL架构图
存储引擎
存储引擎是mysql非常独特的一个设计,使用这个抽象的概念封装了数据库的具体的存储实现,只保留了统一的接口。
这样的优点是不同的开发者可以根据自己的需要实现不同功能的存储引擎。但是缺点是,上层的处理引擎不了解存储引擎的细节无法自己针对其优点进行性能上的优化。所以程序员需要更好的理解这些存储引擎的设计细节,从程序设计方面来让数据库获得更好的性能。
下面列出了一些mysql常用的存储引擎
种类有很多,功能也各有不同,使用较多的是Innodb和MyIsam,我们主要从存储的细节上来理解一下他们的不同。
存储形式主要有两种:堆表、聚集表。
堆表
堆表是指所有的数据按照增加的时间顺序排列在一起,没有特殊的排序。大概类似于如下的形式。
典型代表:MyISAM
优点是
- 数据按照插⼊顺序排列列,插⼊入性能很⾼
- 每⾏数据⽤隐藏的rowid标识(可以理解成数据位置)
- 所有索引记录最终指向rowid,这样按索引扫描的性能也不错。
但是MyISAM存储引擎有个很大的问题,就是它不支持事务,有没有日志机制,会导致在断电时表crash。交易性业务,或者数据安全性要求比较高的场景,不太推荐使用这种存储引擎。
聚集表
聚集这个词稍有有些不好理解,其实意思就是所有的数据按照某一种特定的顺序(比如主键的大小)进行排列,而不是按照增加的时间顺序。
典型代表:InnoDB
优点是
- 数据按主键顺序排列存储,形成树状,主键和数据形成同一个数据结构。
- 每⾏数据以主键标识
- 主键访问非常快,⾮主键索引指向主键,通过主键再访问数据,有一个二次查找的开销。
从这里我们可以看出Innodb得主键查询非常优秀,但是这样的排序存储有一个问题,如果频繁的在数据表中间插入数据,会导致索引结构的不断更新,反而会影响插入的速度。
所以在实践中,我们通常使用顺序增加的键作为主键,在保持主键查询性能的同时获得更好的插入性能。
除了以上存储的特性之外,Innodb最重要的特性是支持事务,可以在数据库断电,或者死机之后恢复到数据一致的状态。
数据的安全性通常是我们最优先考量的指标,由于这个重要的性质,所以在云服务的绝大多数场合,我们更推荐使用Innodb这个存储引擎。