关系数据库设计理论
函数依赖
记A->B表示A函数决定B,也可以说B函数依赖于A。
如果{A1,A2,....,An}是关系的一个或多个属性的集合,该集合函数决定了其它所有属性并且是最小的,那么该集合就称为键码。
对于A->B,如果能找到A的真子集A',是的A'->B,那么A->B就是部分函数依赖,否则就是完全函数依赖。
对于A->B,B->C,则A->C是一个传递函数依赖。
异常
以下的学生课程关系的函数依赖为Sno,Cname->Sname,sdept,Mname。Grade,键码为{Sno,Cname}。也就是说,确定学生和课程之后,就能确定其它信息。
Sno | Sname | Sdept | Mname | Cname | Grade |
---|---|---|---|---|---|
1 | 学生-1 | 学院-1 | 院长-1 | 课程-1 | 90 |
2 | 学生-2 | 学院-2 | 院长-2 | 课程-2 | 80 |
2 | 学生-2 | 学院-2 | 院长-2 | 课程-1 | 100 |
3 | 学生-3 | 学院-2 | 院长-2 | 课程-2 | 95 |
不符合范式的关系,会产生很多异常,主要有以下四种异常:
- 冗余数据:例如 学生-2 出现了两次。
- 修改异常:修改了一个记录中的信息,但是另一个记录中相同的信息却没有被修改。
- 删除异常:删除一个信息,那么也会丢失其他信息。例如删除了 课程-1,需要删除第一行和第三行,那么学生-1的信息就会丢失。
- 插入异常:例如想要插入一个学生的信息,如果这个学生还没有选课,那么就无法插入。
范式
范式理论是为了解决以上提到四种异常。
高级别范式的依赖于低级别的范式,1NF是最低级别的范式。
1.第一范式(1NF)
属性不可分。
2.第二范式(2NF)
每个非主属性完全依赖于键码。
可以通过分解来满足。
分解前
Sno | Sname | Sdept | Mname | Cname | Grade |
---|---|---|---|---|---|
1 | 学生-1 | 学院-1 | 院长-1 | 课程-1 | 90 |
2 | 学生-2 | 学院-2 | 院长-2 | 课程-2 | 80 |
2 | 学生-2 | 学院-2 | 院长-2 | 课程-1 | 100 |
3 | 学生-3 | 学院-2 | 院长-2 | 课程-2 | 95 |
以上学生课程关系中,{Sno,Cname}为键码,有如下函数依赖:
Sno->Sname,Sdept
Sdept->Mname
Sno,Cname->Grade
Grade完全依赖于键码,它没有任何冗余数据,每个学生的每门课都有特定的成绩。
Sname, Sdept 和 Mname 都部分依赖于键码,当一个学生选修了多门课时,这些数据就会出现多次,造成大量冗余数据。
分解后
关系-1
Sno | Sname | Sdept | Mname |
---|---|---|---|
1 | 学生-1 | 学院-1 | 院长-1 |
2 | 学生-2 | 学院-2 | 院长-2 |
3 | 学生-3 | 学院-2 | 院长-2 |
有以下函数依赖:
Sno->Sname,Sdept
Sdept->Mname
关系-2
Sno | Cname | Grade |
---|---|---|
1 | 课程-1 | 90 |
2 | 课程-2 | 80 |
2 | 课程-1 | 100 |
3 | 课程-2 | 95 |
有以下函数依赖:
Sno,Cname->Grade
3.第三范式(3NF)
非主属性不传递函数依赖于键码。
上面的关系-1中存在以下传递函数依赖:
Sno->Sdept->Mname
可以进行以下分解:
关系-11
Sno | Sname | Sdept |
---|---|---|
1 | 学生-1 | 学院-1 |
2 | 学生-2 | 学院-2 |
3 | 学生-3 | 学院-2 |
关系-12
Sdept | Mname |
---|---|
学院-1 | 院长-1 |
学院-2 | 院长-2 |
4.BCNF范式
在3NF的基础上,消除主属性对键码的部分函数依赖和传递函数依赖