2.1 关系数据结构及形式化定义
- 关系数据库系统是支持关系模型的数据库系统。(关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成)
2.1.1 关系
1-域
- 域是一组具有相同数据类型的值的集合。
eg.{0, 1}; {man, woman}
2-笛卡尔积
- 笛卡尔积是域上的一种集合运算
eg.给定一组域D1,D2,D3,,,,则其笛卡尔积为:D1*D2*D3...={(d1,d2,d3,....) | di∈Di}
- 没一个元素(d1,d2,d3...,dn)叫做一个n元组(简称元组),元组的每一个值di叫做一个分量。
- 一个域允许的不同取值个数称为这个域的基数。
3-关系
-
D1*D2*D3...*Dn的子集叫做域在D1,D2,...,Dn上的关系,表示为:R(D1,D2,...,Dn)
-
R表示关系的名字,n表示关系的目或度
-
若关系中的某一属性组能唯一标识一个元组,而其子集不可以,则称该属性组为候选码。
-
候选码中的属性称为主属性,不包含在任何候选码中的属性称为非主属性或非码属性。
-
若一个关系有多个候选码,则选定其中一个为主码(primary key)
-
关系可以有三种类型:基本关系(基本表或基表),查询表和试图表。
- 基本表:实际存在的表,实际存储数据的逻辑表示
- 查询表:查询结果对应的表
- 试图表:由基本表或其他试图表导出的表,虚表,不对应实际存储数据。
基本关系的六条性质:
- 列是同质的:每个列中的分量是同一类型的数据,来自同一个域。
- 不同的列可出自同一个域,此时每一个列为一个属性
- 列的顺序无所谓:列的次序可以任意调换
- 任意两个元组的候选码不能取相同的值
- 行的顺序无所谓
- 分量必须取原子值,每一个分量都必须是不可分的数据项。
2.1.2 关系模式
关系模式是型,关系是值。关系模式是对关系的描述。
-
关系的描述称为关系模式,表示为:R(U,D,DOM,F)
- R:关系名
- U:组成该关系的属性名集合
- D:U中属性所来自的域
- DOM: 属性向域的影响集合
- F:属性间数据的依赖关系集合
-
关系是关系模式在某一时刻的状态和内容。关系模式是静态稳定的,关系是动态随时间变化的(关系操作不断更新着数据库中数据)。
2.1.3 关系数据库
- 关系数据库的型也成为关系数据库模式,是对关系数据库的描述
- 关系数据库的值是这些关系模式在某一时刻对应的关系的集合 - 关系数据库。
2.2 关系操作
2.2.1 基本关系操作
- 查询:集合操作方式,即操作的对象和结果都是集合
- 查询的五种基本操作:选择、投影、并、差、笛卡尔积
- 插入
- 删除
2.2.2 关系数据语言的分类
- 关系代数语言(ISBL)
- 关系演算语言
- 元组关系演算语言(ALPHA,QUEL)
- 域关系盐酸语言(QBE)
- 关系代数和关系演算双重特性:SQL
- SQL是一种结构查询语言,集查询、数据定义、数据操纵和数据控制于译题的关系数据语言。(高度非过成化)
- 修改
2.3 关系完整性
- 关系模型由三类完整性约束:实体完整性、参照完整性(关系的两个不变性)和用户定义的完整性。
2.3.1 实体完整性
- 实体完整性规则:若属性A是基本关系R的主属性,则A不能取空置(null)
2.3.2 参照完整性
若F为基本关系R的一个或一组属性但不是R的码,Ks是基本关系S的主码。若F与Ks相对应,则F是R的外码,R为参照关系,S是被参照关系或目标关系。(RS可为同一关系)
- 参照完整性规则:若属性F是基本关系R的外码,它与基本关系S的主码Ks相对应,则对于R中每个元组在F上的值必须:
- 取空值(F中每个属性值均为空值):尚未给F分配Ks
- 等于S中某个元组的主码值:被参照关系中的一个具体值
2.3.3 用户定义完整性
用户定义完整性即为针对某一具体关系数据库的约束条件,其反映某一具体应用所涉及的数据必须满足的语义要求。
2.4 关系代数
关系代数是一种抽象的查询语言,用对关系的运算来表达查询。
- 关系代数表达式:关系代数中运算经有限次复合后形成的表达式。
2.4.1 传统集合运算(二目运算)
- 并:R∪S={t|t∈R V t∈S}
- 差:R-S={t|t∈R ⋀ t ∉ S}
- 交:R∩S={t|t∈R ⋀ t∈S}
- 笛卡尔积:R*S={tr⌒ts|tr∈R⋀ts∈S}
2.4.2 专门的关系运算
1-符号引入
- 设关系模式为R(A1,A2...An),其一关系设为R,t∈R标识t是R的一个元组。t[Ai]表示元组t中相应于属性Ai的一个分量
- 若R为n目关系,S为m目关系。tr∈R,ts∈S,tr⌒ts称为元组的链接或元组的串接,其是一个n+m列的元组
- 若A={Ai1,Ai2,Ai3,...,Aik},Ain为Ai中的一部分,则A称为属性列或属性组。t[A]=(t[Ai1],t[Ai2],t[Ai3]...)表示元组t在属性列A上诸分量的集合,A平均表示{A1,A2,...}去除{Ai1,Ai2,...}后剩余的属性组。
- 给定关系R(X,Z),XZ为属性组。当t[X]=x时,x在R中的象集定义为:Zx={t[Z]|t∈R,t[X]=x},表示R中属性组X上值x的诸元组在Z上分量的集合。
2-关系运算定义
- 选择(限制)
- 投影:关系R上的投影是从R中选择若干属性列组成新得关系
- 连接(join):两个关系的笛卡尔积中选取属性间满足一定条件的元组
- 除运算:设关系R除关系S结果为关系T,则T包含所有在R但不在S中的属性和值,且T的元组与S的元组的所有组合都在R中。