本节书摘来华章计算机《数据库技术原理与应用教程》一书中的第3章 ,第3.5.3节,徐洁磐 操凤萍 编著更多章节内容可以访问云栖社区“华章计算机”公众号查看。
3.5.3关系模型的数据结构、操纵和约束
关系是一种数学理论,运用这种理论所得到的逻辑模型称关系模型,关系模型由关系数据结构、关系操纵及关系约束三部分组成。
1 关系数据结构
(1)表结构
关系模型统一采用二维表结构。二维表由表框架(frame)及表元组(tuple)组成。表框架由n个命名的属性组成,n称为属性元数(arity),每个属性有一个取值范围(即值域)。
在表框架中可以按行存放数据,每行数据称为一个元组,或称表的实例(instance)。实际上,一个元组由n个元组分量组成,每个元组分量是表框架中每个属性的投影值。一个表框架可以存放m个元组,m称为表的基数(cardinality)。
一个n元表框架及框架内m个元组构成了一个完整的二维表。表34给出了二维表的一个例子,这是一个有关学生(S)的二维表。
表3-4二维表的一个实例
二维表一般满足下面七个性质:
- 二维表中元组个数是有限的——元组个数有限性。
- 二维表中元组均不相同——元组的唯一性。
- 二维表中元组的次序可以任意交换——元组的次序无关性。
- 二维表中元组的分量是不可分割的基本数据项——元组分量的原子性。
- 二维表中属性名各不相同——属性名唯一性。
- 二维表中属性与次序无关——属性的次序无关性(但属性次序一经确定就不能更改)。
- 二维表中属性列中分量具有与该属性相同值域——分量值域的同一性。
(2)关系
关系(relation) 是二维表的一种抽象,它是关系模型的基本数据单位。具有n个属性的关系称n元关系,n=0时称空关系。每个关系有一个名称(即关系名),关系名及关系中的属性构成了关系框架。设关系名为R,其属性为a1, a2, …, an,则该关系的框架是:
R(a1, a2, …,an)
表34所示的关系框架可以表示成:
S(sno,sn,sd,sa)
每个关系有m个元组,设关系的框架为R(a1, a2,…, an),则其元组必具有下面的形式:
(a11, a12, … , a1n)
(a21, a22, … , a2n)
(am1, am2, … , amn)
其中aij(i∈{1,2,…,n},j∈{1,2,…,m})为元组分量。
按关系框架所组成的关系元组集合可构成一个关系。如表34所示的关系R可表示为:R={(98001,张曼英,CS,18),(98002,丁一明,CS,20),(98003,王爱国,CS,18),(98004,李强,CS,21)}。
一个语义相关的关系集合构成一个关系数据库(relational database)。而语义相关的关系框架集合则构成关系数据库模式(relational database schema),简称关系模式(relational schema)。
关系模式支持子模式,关系子模式是关系数据库模式中用户所见到的那部分数据描述。关系子模式也是二维表结构,它对应着用户数据库,即视图(view)。
关系与二维表是一个概念的两种不同表示形式,一般在理论研究中用关系讨论而在实际应用中则用二维表表示,在本书中基本上按此方法但并不严格区分。
(3)键
键是关系模型中的一个重要概念,它具有标识元组、建立元组间联系等重要作用。
- 键(key):二维表中凡能唯一最小标识元组的属性集称为该表的键。
- 候选键(candidate key):二维表中可能有若干个键,它们称为该表的候选键。
- 主键(primary key):从二维表的所有候选键中选取一个作为用户使用的键称为主键。主键一般也简称键。
- 外键(foreign key):若表A中的某属性集是表B的键,则称该属性集为A的外键。
表一定有键,因为如果表中所有属性子集均不是键则至少表中属性全集必为键,因此也一定有主键。
(4)关系与ER模型
虽然关系的结构简单,但它的表示范围广,ER模型中的属性、实体(集)及联系均可用它表示,表35给出了ER模型与关系间的比较。
在关系模型中,关系既能表示实体集又能表示联系。表36给出了某公司职工间上下级联系的关系表示。
2关系操纵
关系模型的数据操纵就是建立在关系上的一些操作,一般有查询、删除、插入及修改四种操作。
(1)数据查询
用户可以查询关系数据库中的数据,它包括一个关系内的查询以及多个关系间的查询。
1)一个关系内查询的基本单位是元组分量,其基本过程是先定位后操作。所谓定位,包括纵向定位与横向定位,纵向定位就是指定关系中的一些属性(称列指定),横向定位就是选择满足某些逻辑条件的元组(称行选择)。通过纵向与横向定位后就可确定一个关系中的元组分量了。在定位后即可进行查询操作,即将定位的数据从关系数据库中取出并放入至指定内存。
2)多个关系间的数据查询可分为3步进行。第1步将多个关系合并成一个关系,第2步对合并后的一个关系进行定位,最后进行查询操作。其中,第2步与第3步可看作一个关系内的查询,故我们只介绍第1步。多个关系的合并可分解成两个关系的逐步合并,如果有3个关系R1、R2与R3,那么合并过程是先将R1与R2合并成R4,然后再将R4与R3合并成最终结果R5。
因此,对关系数据库的查询可以分解成三个基本定位操作与一个查询操作:
- 一个关系内的属性指定。
- 一个关系内的元组选择。
- 两个关系的合并。
- 查询操作。
(2)数据删除
数据删除的基本单位是元组,用于将指定关系内的指定元组删除。它也分为定位与操作两部分,其中定位部分只需要横向定位而无需纵向定位,定位后即是执行删除操作。因此,数据删除可以分解为两个基本操作:
- 一个关系内的元组选择。
- 关系中元组的删除操作。
(3)数据插入
数据插入仅用于一个关系,即在指定关系中插入一个或多个元组。插入数据时不需定位,只需将元组插入关系。因此,数据插入只有一个基本操作:
关系中的元组插入操作。
(4)数据修改
数据修改是在一个关系中修改指定的元组与属性值。数据修改不是一个基本操作,它可以分解为两个更基本的操作:先删除需修改的元组,然后插入修改后的元组。
(5)关系操作小结
以上四种操作的对象都是关系,而操作结果也是关系,因此它们都是建立在关系上的操作。这四种操作可以分解成6种基本操作。这样,关系模型的数据操纵可以总结如下:
1)关系模型数据操纵的对象是关系,而操纵结果也是关系。
2)关系模型基本操作有如下六种(其中三种为定位操作,三种为查询、插入及删除操作):
- 关系属性的指定。
- 关系元组的选择。
- 两个关系合并。
- 关系的查询操作。
- 关系中元组的插入操作。
- 关系中元组的删除操作。
(6)空值处理
在关系元组的分量中允许出现空值(null value)以表示信息的空缺,空值的含义如下:
- 未知的值。
- 不可能出现的值。
在出现空值的元组分量中一般可用NULL表示。目前的关系数据库系统都支持空值,但是它们都具有如下两个限制:
1)关系的主键中不允许出现空值。因为主键是关系元组的标识,如主键为空值则失去了其标识的作用。
2)需要定义有关空值的运算。在算术运算中如果出现空值则其结果为空值,在比较运算中如果出现空值则其结果为F(假)。此外,在统计时,如果SUM、AVG、MAX、MIN中有空值输入,其结果也为空值,而在作COUNT时如有空值输入则其值为0。
3 关系中的数据约束
关系模型允许定义三类数据约束,分别是实体完整性约束、参照完整性约束以及用户定义的完整性约束。此外,关系的安全性约束、故障恢复与多用户的并发控制实际上也是数据约束,其具体说明可见第5章。