01)关系型数据库和非关系型数据库
关系型数据库是:是基于关系模型提出来的数据库,关系模型是用一张二维表来表示和存储数据的,关系型数据库支持事务;
非关系型数据库(NoSQL)是:键值对的方式进行存储数据,key-value。是分布式的,一般不支持acid特性。
02)数据库和实例
数据库就是一堆文件,是一个物理概念;数据库文件里面的一堆文件加载到内存中,把内存中的镜像叫做实例,实例是一个 逻辑概念;
操作数据库,需要通过操作实例,而数据库实例才是真正用于操作数据库文件的。
MySQL被设计为一个单进程多线程的架构的数据库,MySQL数据库实例在系统上的表现就是一个进程。
Oracle体系结构
01)Oracle的集群
02)Oracle的体系结构
任何语言都是以操作系统的进程来操作数据库文件的。
在图中,客户端(如jdbc)连接到数据库,一般图里面的小方块和连接数是一样的;一个实例只有一个大方块。
大方块是:SGA(system global area系统全局区)
小方块是:PGA(Process global area)
客户端操作数据,保存在PGA中,操作完之后commit提交,PGA写入到SGA,SGA通过写进程,写入数据库文件。这样就是通过两个阶段提交数据,写入速度更快。因为如果PGA直接写入数据库,那么三个PGA就需要写三次,如果提交到SGA只需要写一次。
mysql的体系结构
了解MySql必须牢牢记住其体系结构图,Mysql是由SQL接口,解析器,优化器,缓存,存储引擎组成的
1 Connectors指的是不同语言中与SQL的交互
2 Management Serveices & Utilities: 系统管理和控制工具
3 Connection Pool: 连接池。
管理缓冲用户连接,线程处理等需要缓存的需求
4 SQL Interface: SQL接口。
接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface
5 Parser: 解析器。
SQL命令传递到解析器的时候会被解析器验证和解析。解析器是由Lex和YACC实现的,是一个很长的脚本。
主要功能:
a . 将SQL语句分解成数据结构,并将这个结构传递到后续步骤,以后SQL语句的传递和处理就是基于这个结构的
b. 如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的
6 Optimizer: 查询优化器。
SQL语句在查询之前会使用查询优化器对查询进行优化。他使用的是“选取-投影-联接”策略进行查询。
用一个例子就可以理解: select uid,name from user where gender = 1;
这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行gender过滤
这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤
将这两个查询条件联接起来生成最终查询结果
7 Cache和Buffer: 查询缓存。
如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。
这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等
8 Engine :存储引擎。
存储引擎是MySql中具体的与文件打交道的子系统。也是Mysql最具有特色的一个地方。
Mysql的存储引擎是插件式的。它根据MySql AB公司提供的文件访问层的一个抽象接口来定制一种文件访问机制(这种访问机制就叫存储引擎)
现在有很多种存储引擎,各个存储引擎的优势各不一样,最常用的MyISAM,InnoDB,BDB
Mysql也支持自己定制存储引擎,甚至一个库中不同的表使用不同的存储引擎,这些都是允许的。
01)MyISAM引擎
01.mysql在5.5.5版本之前都是MyISAM引擎,面向OLAP(联机分析处理:快速分析和观察数据)
02.mysql的系统表大都也是MyISAM引擎,MYD(数据文件)、MYI(索引文件)、frm(表定义)
03.mysql引擎的特点:
不支持事务;
表级锁定,锁粒度大;
只会缓存索引;
读写互相阻塞;
读取速度快;
不支持外键约束。
04.数据库系统与文件系统很大的一个不同之处就是在于对事务的支持,然而myisam存储引擎是不支持事务的。(原因很简单,如果没有ETL这些操作,只是简单的报表查询是否还需要事务的支持呢?)
05.myisam存储引擎的另外一个与众不同的地方就是它的缓冲池只缓存索引文件,而不是缓冲数据文件。
02)InnoDB引擎
设计目标主要面向在线事务处理(OLTP)的应用。
特点:
01.支持事务;
02.行级锁定;
03.读写阻塞与事务相关;
04.具有非常高效的缓存特性,可以缓存索引,也可以缓存数据;
05.整个表和主键以cluster方式存在,组成一颗平衡树;
06.所有Secondery Index都会保存主键信息;
07.支持分区分表;
08.支持外键约束,5.5之前不支持全文索引,之后支持了;
09.与MyISAM相比,InnoDB对硬件资源要求更高。
03)Memory
将表的数据放在内存中,如果数据库重启或者发生崩溃,表中的数据都将消失。memory存储引擎默认使用哈希索引,而不是 我们熟悉的B+索引。
memory存储引擎速度非常快,但是在使用上还是有一定限制。比如只支持表锁,并发性差,不支持text和blob列类型;并且char和varchar一样使用固定内存。
04)Archive
这个存储引擎只支持insert和select操作,从MySQL5.1开始支持索引。archive存储引擎非常适合存储归档数据,如日志信息。其设计目标主要是提供高速的插入和压缩功能。
05)NDB
是一个集群存储引擎,ndb的特点是数据全部放在内存中(从MySQL5.1开始,可以将非索引数据放在磁盘上),因此主键查找速度很快。
需要注意的是,ndb的连接操作是在MySQL数据层完成的,而不是在存储引擎层完成的。这意味着,复杂的连接操作需要巨大的网络开销,因此查询速度很慢。
>show engines\G;
观察MySQL数据库启动后的进程情况:
#ps -ef | grep mysqld
查看当MySQL数据库实例启动时,会在哪些位置查找配置文件:
#mysql --help | grep my.cnf
查看MySQL的默认数据文件:
>show variables like 'datadir'\G;
查看MySQL支持的存储引擎:
>show engines\G;
创建表指定存储引擎 :
>create table mytest Engine=InnoDB;
>alter table mytest Engine=MyISAM;