数据库系统原理---关系数据库设计理论

关系数据库设计理论

函数依赖

  记A->B表示A函数决定B,也可以说B函数依赖于A

  如果{A1,A2,....,An}是关系的一个或多个属性的集合,该集合函数决定了其它所有属性并且是最小的,那么该集合就称为键码

  对于A->B,如果能找到A的真子集A',是的A'->B,那么A->B就是部分函数依赖,否则就是完全函数依赖

  对于A->B,B->C,则A->C是一个传递函数依赖

异常

  以下的学生课程关系的函数依赖为Sno,Cname->Sname,sdept,Mname。Grade,键码为{Sno,Cname}。也就是说,确定学生和课程之后,就能确定其它信息。

Sno Sname Sdept Mname Cname Grade
1 学生-1 学院-1 院长-1 课程-1 90
2 学生-2 学院-2 院长-2 课程-2 80
2 学生-2 学院-2 院长-2 课程-1 100
3 学生-3 学院-2 院长-2 课程-2 95

不符合范式的关系,会产生很多异常,主要有以下四种异常:

  • 冗余数据:例如 学生-2 出现了两次。
  • 修改异常:修改了一个记录中的信息,但是另一个记录中相同的信息却没有被修改。
  • 删除异常:删除一个信息,那么也会丢失其他信息。例如删除了 课程-1,需要删除第一行和第三行,那么学生-1的信息就会丢失。
  • 插入异常:例如想要插入一个学生的信息,如果这个学生还没有选课,那么就无法插入。

范式

范式理论是为了解决以上提到四种异常。

  高级别范式的依赖于低级别的范式,1NF是最低级别的范式。

1.第一范式(1NF)

  属性不可分

2.第二范式(2NF)

  每个非主属性完全依赖于键码

  可以通过分解来满足。

分解前

Sno Sname Sdept Mname Cname Grade
1 学生-1 学院-1 院长-1 课程-1 90
2 学生-2 学院-2 院长-2 课程-2 80
2 学生-2 学院-2 院长-2 课程-1 100
3 学生-3 学院-2 院长-2 课程-2 95

以上学生课程关系中,{Sno,Cname}为键码,有如下函数依赖:

  Sno->Sname,Sdept

  Sdept->Mname

  Sno,Cname->Grade

  Grade完全依赖于键码,它没有任何冗余数据,每个学生的每门课都有特定的成绩。

  Sname, Sdept 和 Mname 都部分依赖于键码,当一个学生选修了多门课时,这些数据就会出现多次,造成大量冗余数据。

分解后

关系-1

Sno Sname Sdept Mname
1 学生-1 学院-1 院长-1
2 学生-2 学院-2 院长-2
3 学生-3 学院-2 院长-2

有以下函数依赖:

  Sno->Sname,Sdept

  Sdept->Mname

关系-2

Sno Cname Grade
1 课程-1 90
2 课程-2 80
2 课程-1 100
3 课程-2 95

有以下函数依赖:

  Sno,Cname->Grade

3.第三范式(3NF)

  非主属性不传递函数依赖于键码

上面的关系-1中存在以下传递函数依赖:

  Sno->Sdept->Mname

可以进行以下分解:

关系-11

Sno Sname Sdept
1 学生-1 学院-1
2 学生-2 学院-2
3 学生-3 学院-2

关系-12

Sdept Mname
学院-1 院长-1
学院-2 院长-2
4.BCNF范式

  在3NF的基础上,消除主属性对键码的部分函数依赖和传递函数依赖

上一篇:MySQL查询语句


下一篇:数据笔试题