MYSQL实战-------丁奇(极客时间)学习笔记

1.基础架构:一条sql查询语句是如何执行的?

mysql> select * from T where ID=10;

MYSQL实战-------丁奇(极客时间)学习笔记

2.基础架构:一条sql更新语句是如何执行的?

mysql> update T set c=c+1 where ID=2;

redo log

(1)存储引擎的日志,InnoDB特有的;

(2)物理日志

(3)循环写,空间固定会用完;

binlog

(1)server端日志,所有引擎都有;

(2)逻辑日志

(3)追加写,文件写到一定大小,切换下一个,并不会覆盖之前的日志;

MYSQL实战-------丁奇(极客时间)学习笔记

redolog的写入拆分成两个步骤:prepare和commit

redo log 和binlog都可以用于表示事务的提交状态,两阶段提交是为了维持这两个状态一致。

恢复:

MYSQL实战-------丁奇(极客时间)学习笔记

注:正常执行redolog commit;崩溃恢复的时候可以接受redolog prepare并且binglog完整

3.事务隔离

MyISAM不支持事务,InnoDB 支持事务

读未提交:别人改数据的事务尚未提交,我在我的事务中也能读到。
读已提交:别人改数据的事务已经提交,我在我的事务中才能读到。
可重复读:别人改数据的事务已经提交,我在我的事务中也不去读。(对账的例子)
串行:我的事务尚未提交,别人就别想改数据。

https://blog.csdn.net/changhenshui1990/article/details/77161401

 4.索引(上)

索引---目录:提供数据查询的效率

(1)哈希表:适合等值查询的场景

缺点:范围查找比较麻烦

哈希冲突:链表(两个key生成的N一样)

MYSQL实战-------丁奇(极客时间)学习笔记

(2)有序数组:等值查找,范围查询性能都很好、只适合静态存储引擎

缺点:更新比较麻烦

MYSQL实战-------丁奇(极客时间)学习笔记

(3)二叉搜索树:每个节点的左儿子小于父节点,父节点又小于右儿子

MYSQL实战-------丁奇(极客时间)学习笔记

InnoDB的索引模型

B+树索引模型

mysql> create table T(

id int primary key,
k int not null,
name varchar(16),
index (k))engine=InnoDB;

MYSQL实战-------丁奇(极客时间)学习笔记

索引类型:主建索引、非主建索引

主建索引的叶子节点存储:整行数据(聚簇索引),主建索引只要搜索id这个B+ Tree就可以拿到数据

非主建索引叶子节点:主建的值(二级索引),普通索引先搜索索引拿到主建值,再到主建索引搜索一次(回表)

索引维护:

一个数据页满了,按照B+Tree算法,新增加一个数据页,叫做页分裂,会导致性能下降。空间利用率降低大概50%。当相邻的两个数据页利用率很低的时候会做数据页合并,合并的过程是分裂过程的逆过程。

性能和存储上来考虑,自增主建往往是更合理的选择;递增插入,追加,不会触发叶子节点分裂。

业务字段用作主建:(1)只有一个索引(2)该索引必须唯一索引。-------------------------直接将这个索引设置成主建,避免每次查询搜索两棵树。

 5.索引(下)

(1)覆盖索引:select ID from T where k betwe 3 and 5  不需要回表(回到主键索引树搜索的过程,成为回表)

MYSQL实战-------丁奇(极客时间)学习笔记

(2)前缀索引

(3)索引下推

总结:
1、覆盖索引:如果查询条件使用的是普通索引(或是联合索引的最左原则字段),查询结果是联合索引的字段或是主键,不用回表操作,直接返回结果,减少IO磁盘读写读取正行数据
2、最左前缀:联合索引的最左 N 个字段,也可以是字符串索引的最左 M 个字符
3、联合索引:根据创建联合索引的顺序,以最左原则进行where检索,比如(age,name)以age=1 或 age= 1 and name=‘张三’可以使用索引,单以name=‘张三’ 不会使用索引,考虑到存储空间的问题,还请根据业务需求,将查找频繁的数据进行靠左创建索引。
4、索引下推:like 'hello%’and age >10 检索,MySQL5.6版本之前,会对匹配的数据进行回表查询。5.6版本后,会先过滤掉age<10的数据,再进行回表查询,减少回表率,提升检索速度

6.数据库锁——行锁,表锁

锁:并发

(1)全局锁:对整个数据库实例加锁,全库数据备份的时候用;(InnoDB采用事务,可重复读可以支持;不支持事务的引擎不能够实现,采用FTWRL)  FTWRL——保证只读

(2)表级锁:表锁、元数据锁;

(3)行级锁:InnoDB(行锁)、MyIsAM(不支持行锁)

7.索引选择——唯一索引,普通索引

8.给字符串字段加索引

前缀索引

mysql> alter table SUser add index index1(email);

mysql> alter table SUser add index index2(email(6));

MYSQL实战-------丁奇(极客时间)学习笔记

MYSQL实战-------丁奇(极客时间)学习笔记

MYSQL实战-------丁奇(极客时间)学习笔记

MYSQL实战-------丁奇(极客时间)学习笔记

使用前缀索引,定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本

前缀索引对覆盖索引的影响:

MYSQL实战-------丁奇(极客时间)学习笔记

其他方式: 倒序存储、hash字段

9.mysql "抖"了一下

WAL:先写日志,再写磁盘

刷脏页(flush)

(1)InnoDB的redo log满了的时候

(2)内存不够用了,先将脏页写到磁盘

(3)mysql系统空闲的时候

(4)mysql正常关闭的时候

10.数据删除,表文件大小不变

InnoDB:表结构(.frm)定义和数据(.ibd)。

delete 命令其实只是把记录的位置,或者数据页标记为“可复用”,但磁盘文件的大小是不会变的。----空洞

重建表可以收缩空间

11.count(*)的实现

MyISAM:一个表的总行数存在了磁盘上

InnoDB:把数据一行一行地从引擎里面读出来,然后累加

MYSQL实战-------丁奇(极客时间)学习笔记

MYSQL实战-------丁奇(极客时间)学习笔记

count(字段)<count(主建id)<count(1)约等于count(*)

12.order by的原理

(1)全字段排序:

MYSQL实战-------丁奇(极客时间)学习笔记

缺点:
1.造成sort_buffer中存放不下很多数据,因为除了排序字段还存放其他字段,对sort_buffer的利用效率不高
2.当所需排序数据量很大时,会有很多的临时文件,排序性能也会很差
优点:MySQL认为内存足够大时会优先选择全字段排序,因为这种方式比rowid 排序避免了一次回表操作

(2)rowId排序

MYSQL实战-------丁奇(极客时间)学习笔记

优点:更好的利用内存的sort_buffer进行排序操作,尽量减少对磁盘的访问
缺点:回表的操作是随机IO,会造成大量的随机读,不一定就比全字段排序减少对磁盘的访问

13.mysql随机消息

mysql> select word from words order by rand() limit 3;

14.逻辑相同的sql语句性能相差很大

(1)条件字段函数

mysql> select count(*) from tradelog where month(t_modified)=7;

如果对字段做了函数计算,就用不上索引了,这是 MySQL 的规定。

MYSQL实战-------丁奇(极客时间)学习笔记

对索引字段做函数操作,可能会破坏索引值的有序性,因此优化器就决定放弃走树搜索功能。

mysql> select count(*) from tradelog where
-> (t_modified >= '2016-7-1' and t_modified<'2016-8-1') or
-> (t_modified >= '2017-7-1' and t_modified<'2017-8-1') or
-> (t_modified >= '2018-7-1' and t_modified<'2018-8-1');

(2)隐式类型转换

mysql> select * from tradelog where tradeid=110717;

相当于 mysql> select * from tradelog where CAST(tradid AS signed int) = 110717;

对索引字段做函数操作,优化器会放弃走树搜索功能。

(3)隐式字符串编码转换

15.查一行数据也很慢

(1)查询长时间不返回:等MDL锁、等flush、等行锁

(2)查询慢:没有加索引,需要全表扫描;

16.幻读

间隙锁

17.mysql如何保证数据不丢失

MYSQL实战-------丁奇(极客时间)学习笔记

18.mysql主备一致:binlog归档

MYSQL实战-------丁奇(极客时间)学习笔记

binlog的格式:

(1)statement

MYSQL实战-------丁奇(极客时间)学习笔记

(2)row

(3)mixed

19.mysql如何保证高可用

主备(写数据)、主从(读数据)------一主多从

MYSQL实战-------丁奇(极客时间)学习笔记

MYSQL实战-------丁奇(极客时间)学习笔记

20.mysql读写分离

MYSQL实战-------丁奇(极客时间)学习笔记

MYSQL实战-------丁奇(极客时间)学习笔记

21.join

select * from t1 straight_join t2 on (t1.b=t2.b) where t2.id<=50;
select * from t2 straight_join t1 on (t1.b=t2.b) where t2.id<=50;

第二条语句更好,小表作为驱动表;

22.分区表

CREATE TABLE `t` (
`ftime` datetime NOT NULL,
`c` int(11) DEFAULT NULL,
KEY (`ftime`)
) ENGINE=InnoDB DEFAULT CHARSET=latin1
PARTITION BY RANGE (YEAR(ftime))
(PARTITION p_2017 VALUES LESS THAN (2017) ENGINE = InnoDB,
PARTITION p_2018 VALUES LESS THAN (2018) ENGINE = InnoDB,
PARTITION p_2019 VALUES LESS THAN (2019) ENGINE = InnoDB,
PARTITION p_others VALUES LESS THAN MAXVALUE ENGINE = InnoDB);
insert into t values('2017-4-1',1),('2018-4-1',1);

MYSQL实战-------丁奇(极客时间)学习笔记

索引参考:https://blog.csdn.net/tongdanping/article/details/79878302

https://www.cnblogs.com/yuyue2014/p/3662005.html

http://blog.codinglabs.org/articles/theory-of-mysql-index.html

MYSQL实战-------丁奇(极客时间)学习笔记

MYSQL实战-------丁奇(极客时间)学习笔记

https://www.cnblogs.com/liqiangchn/p/9066686.html

上一篇:java 使用 poi 解析excel


下一篇:IntelliJ IDEA注册码