剑指Offer——知识点储备-数据库基础
数据库
事务
事务的四个特性(ACID):
原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)
- (1)原子性
整个事务中的所要操作要么全部提交成功,要么全部失败回滚。
- (2)一致性
保证数据库中的数据操作之前和操作之后的一致性。(比如用户多个账户之间的转账,但是用户的总金额是不变的)
- (3)隔离性
隔离性要求一个事务对数据库中数据的修改,在未提交完成前对于其它事务是不可见的。(即事务之间要串行执行)
在SQL标准中定义了四种隔离性:(下面隔离性是由低到高,并发性由高到低)
- 1)未提交读 最低的隔离等级,允许其他事务看到没有提交的数据,会导致脏读。
- 2)已提交读
由于数据库是读写分离,事务读取的时候获取读锁,但是在读完之后立即释放,释放读锁之后,就可能被其他事务修改数据,再进行读是就发现前后读取数据的结果不同,造成不可重复读。(读锁不需要事务提交后释放,而写锁需要事务提交后释放) - 3)可重复读
所有被select获取的数据都不能被修改,这样就可以避免一个事务前后读取不一致的情况。但是没有办法控制幻读,因为这个时候其他事务不能更改所选的数据,但是可以增加数据; - 4)可串行化
所有事务一个接着一个执行,这样可以避免幻读,对于基于锁来实现并发控制的数据库来说,串行化要求在执行范围查询的时候,需要获取范围锁,如果不是基于锁实现并发控制的数据库,则检查到有违反串行操作的事务时,需回滚该事务。 - 总结:四个级别逐渐增强,每个级别解决问题,事务级别越高,性能越差,大多数环境下(read committed就可以用了)
隔离级别 脏读 不可重复读 幻读
未提交读(read uncommitted) 可能 可能 可能
已提交读(read committed) 不可能 可能 可能
可重复读(repeatable read) 不可能 不可能 可能
可串行化(serializable) 不可能 不可能 不可能
- 总结:未提交读会造成脏读—>已提交读解决脏读,但会造成不可重复读—>可重复读解决读取结果前后不一致的情况,但是造成幻读(以前没有,现在有)—>可串行化解决了幻读,但是增加很多范围锁,可能会造成锁超时;
- (4)持久性 一旦事务提交,则其所做的修改就会永久保存到数据库中,此时即使系统崩溃,已提交的修改数据也不会丢失。
脏读、不可重复读和幻读
- (1)脏读(针对回滚的操作):事务T1更新了一行记录的内容,但是并没有提交所做的修改,事务T2读取更新后的行,然后T1执行了回滚操作,取消了刚才所做的修改。现在T2读取的行数就无效了(一个事务读取了另一个事务);
- (2)不可重复读(针对修改的操作):事务T1读取了一行记录,紧接着T2修改了T1刚才读取的那一行记录,然后T1又再次读取这行记录,发现与刚才读取的结果不同。
- (3)幻读(针对更新的操作):事务T1读取一条指定的where子句所返回的结果集,然后T2事务新插入一行记录,这行记录恰好可以满足T1所使用的查询条件。然后T1再次对表进行检索,但又看到了T2插入的数据。(第一次没看到,第二次看到了)
索引
2.1 数据库索引的优缺点以及什么时候数据库索引失效?
索引的特点
(1)可以加快数据库的检索速度;
(2)只能创建在表上,不能创建到视图上;
(3)既可以直接创建又可以间接创建;
(4)可以在优化隐藏中使用索引;
(5)使用查询处理器执行sql语句,在一个表上,一次只能使用一个索引。
索引的优点
(1)创建唯一性索引,保证数据库表中每一行数据的唯一性;
(2)大大加快数据的检索速度,这是创建索引的最主要原因;
(3)加速数据库表之间的链接,特别是在实现数据库的参考完整性方面特别有意义;
(4)在使用分组和排序子句进行检索时,同样可以显著减少查询中分组和排序的时间;
(5)通过使用索引,可以在查询中使用优化隐藏器,提高系统的性能;
索引的缺点
(1)创建索引和维护索引要耗费时间,这种时间随着数量的增加而增加;
(2)索引需要占用物理空间,除了数据表占用数据空间之外,每一个索引还要占用一定的物理空间,如果建立聚集索引,那么需要的空间就会更大;
(3)当对表中的数据进行增加、删除和修改的时候,索引也需要维护,降低数据维护的速度;
索引分类
(1)普通索引(它没有任何限制。)
(2)唯一性索引(索引列的值必须唯一,但允许有空值。)
(3)主键索引(一种特殊的唯一索引,不允许有空值。一般是在建表的时候同时创建主键索引。)
(4)组合索引
(5)聚集索引 按照每张表的主键构造一颗B+树,并且叶节点中存放着整张表的行记录数据,因此也让聚集索引的叶节点成为数据页。
(6)非聚集索引(辅助索引)(页节点不存放一整行记录)。
索引失效
(1)如果条件中有or,即使其中有条件带索引,也不会使用(尽量少用or);
(2)Like查询是以%开头,例如SELECT * FROM mytable WHEREt Name like’%admin’;
(3)如果列类型是字符串,那一定要在条件中使用引号引起来,否则不会使用索引;
各引擎支持索引:(核心弄懂B-Tree索引)
MyISAM,InnoDB,Memonry三个常用MySQL引擎类型比较
索引 MyISAM索引 InnoDB索引 Memonry索引
B-tree索引 支持 支持 支持
Hash索引 不支持 不支持 支持
R-Tree索引 支持 不支持 不支持
Full-text索引 不支持 暂不支持 不支持
数据库中的索引结构?什么情况下适合建索引?
数据库中的索引结构?
因为在使用二叉树的时候,由于二叉树的深度过大而造成I/O读写过于频繁,进而导致查询效率低下。因此采用多路树结构,B树的各种操作能使B树保持较低的高度。
B树又叫平衡多路查找树,一棵m阶的B树特性如下:
- 1.树中每个结点最多含有m个孩子(m>=2);
- 2.除根结点和叶子结点外,其他每个结点至少有(ceil(m/2))个孩子(其中ceil(x)是一个取上限的函数);
- 3.根结点至少有2个孩子(除非B树只包含一个结点:根结点);
- 4.所有叶子结点都出现在同一层,叶子结点不包含任何关键字信息(可以看做是外部结点或查询失败的结点,指向这些结点的指针都为null);(注:叶子结点只是没有孩子和指向孩子的指针,这些结点也存在,也有元素,类似红黑树中,每一个null指针即当做叶子结点,只是没画出来而已)
B+树
在什么情况下适合建立索引?
(1)为经常出现在关键字order by, group by, distinct后面的字段,建立索引;
(2)在union等集合操作的结果集字段上建立索引,其建立索引的目的同上;
(3)为经常用作查询选择的字段,建立索引;
(4)在经常用做表链接的属性上,建立索引;
(5)考虑使用索引覆盖,对数据很少被更新的表,如果用户经常只查询其中的几个字段,可以考虑在这几个字段上建立索引,从而将表的扫描改变为索引的扫描。
Mysql语法顺序
即当sql中存在下面的关键字时,它们要保持这样的顺序:
select[distinct]、from、join(如left join)、on、where、group by、having、union、order by、limit;
Mysql执行顺序
即在执行时sql按照下面的顺序进行执行:
from、on、join、where、group by、having、select、distinct、union、order by
group by要和聚合函数一起使用,例如:
select a.Customer,sum(a.OrderPrice) from orders a where a.Customer=’Bush’ or a.Customer = ‘Adams’ group by a.Customer
实现多表查询(内连接)
select u.uname,a.addr from lm_user u inner join lm_addr a on u.uid = a.uid;
使用select from where同样可以实现
select u.uname,a.addr from lm_user u, lm_addr a where u.uid = a.uid;
存储过程
delimiter
delimiter ;
调用存储过程
call procedure_bill();
查看存储过程
show procedure status like ‘procedure_bill’;
在MySQL数据库建立多对多的数据表关系
在数据库中,如果两个表的之间的关系为多对多的关系,如:“学生表和课程表”,一个学生可以选多门课,一门课也可以被多个学生选;根据数据库的设计原则,应当形成第三张关联表。
步骤1:创建三张数据表Student ,Course,Stu_Cour
/**学生表*/
CREATE TABLE Student (
stu_id INT AUTO_INCREMENT,
NAME VARCHAR(30),
age INT ,
class VARCHAR(50),
address VARCHAR(100),
PRIMARY KEY(stu_id)
)
/*学生课程表*/
CREATE TABLE Course(
cour_id INT AUTO_INCREMENT,
NAME VARCHAR(50),
CODE VARCHAR(30),
PRIMARY KEY(cour_id)
)
/**学生课程关联表*/
CREATE TABLE Stu_Cour(
sc_id INT AUTO_INCREMENT,
stu_id INT ,
cour_id INT,
PRIMARY KEY(sc_id)
)
第二步:为Stu_Cour关联表添加外键
/*添加外键约束*/
ALTER TABLE Stu_Cour ADD CONSTRAINT stu_FK1 FOREIGN KEY(stu_id) REFERENCES Student(stu_id);
ALTER TABLE Stu_Cour ADD CONSTRAINT cour_FK2 FOREIGN KEY(cour_id) REFERENCES Course(cour_id);
完成创建!
- 注:为已经添加好的数据表添加外键:
-语法:alter table 表名 add constraint FK_ID foreign key(你的外键字段名) REFERENCES 外表表名(对应的表的主键字段名); 例: alter table tb_active add constraint FK_ID foreign key(user_id) REFERENCES tb_user(id);
SQL优化
NO SQL 数据库
常用的数据库有哪些?Redis用过么?
常用的关系数据库:
Mysql、SQLServer、Oracle
常用的无模式数据库:
MongoDB, Merncached,redis……
Redis
(1)Redis是一个速度非常快的非关系数据库,可以存储键(Key)与5种不同类型的值(value)之间的映射,可以将存储在内存中的键值对数据持久化到硬盘中。
(2)与Merncached相比
1)两者都可以用于存储键值映射,彼此性能也相差无几;
2)redis能够自动以两种不同的方式将数据写入硬盘;
3)redis除了能存储普通的字符串键之外,还可以存储其他4种数据结构,merncached只能存储字符串键;
4)redis既能作主数据库,也可以作为其他存储系统的辅助数据库;
数据库引擎(存储引擎)
引擎是什么?
当你访问数据库时,不管是手工访问,还是程序访问,都不是直接读写数据库文件,而是通过数据库引擎去访问数据库文件。
以关系型数据库为例,你发SQL语句给数据库引擎,数据库引擎解释SQL语句,提取出你需要的数据返回给你。因此,对访问者来说,数据库引擎就是SQL语句的解释器。
MYISAM和InnoDB引擎的区别
主要区别:
- (1)MYISAM 是非事务安全型的,而InnoDB是事务安全型;
- (2)NYISAM锁的粒度是表级锁,而InnoDB支持行级锁;
- (3)MYISAM支持全文本索引,而InnoDB不支持全文索引
- (4)MYISAM相对简单,所以在效率上要优于InnoDB,小型应用可以考虑使用MYISAM;
- (5)MYISAM表是保存成文件的形式,在跨平台的数据转移中使用MYISAM存储会省去不少的麻烦;
- (6)InnoDB表比MYISAM表更安全,可以在保证数据不丢失的情况下,切换非事务表到事务表;
应用场景:
- (1)MYISAM管理非事务表,它提供高速存储和检索,以及全文搜索能力,如果应用中需要执行大量的select查询,那么MYISAM是更好的选择。
- (2)InnoDB用于事务处理应用程序,具有众多特性,包括ACID事务支持。如果应用中需要执行大量的insert或update操作,则应该使用innodb,这样可以提高多用户并发操作的性能。
其他
数据库中的范式有哪些
目前关系数据库有6种范式:第一范式{1NF},第二范式{2NF},第三范式{3NF},巴斯—科德范式{BCNF},第四范式{4NF},第五范式{5NF,又称完美范式}。满足最低要求的范式是第一范式。在第一范式的基础上进一步满足更多规范要求的称为第二范式{2NF},其余范式依次类推,一般来说,数据库只需满足第三范式(3NF)就OK了。
范式:
- (1)1NF:确保每列保持原子性;
- (2)2NF:确保表中的每列都和主键相关(联合主键);
- (3)3NF:确保表中的每列都和主键直接相关(外键);
- (4)BCNF:在1NF基础上,任何非主属性不能对主键子集依赖(在3NF基础上消除对主码子集的依赖);
- (5)4NF:要求把同一表内的多对多关系删除;
- (6)5NF:从最终结构重新建立原始结构;