数据库的三大范式

一、三大范式通俗解释:

1.简单的归纳为:

  • 第一范式:字段不可分
  • 第二范式:有主键,非主键字段依赖主键
  • 第三范式:非主键字段不能相互依赖

2.解释为:

  • 第一范式:原子性,字段不可在分,否则就不是关系数据库
  • 第二范式:唯一性,一个表只说明一个事务
  • 第三范式:每列都与主键有直接关系,不存在传递依赖

二、例子说明

1. 不符合第一字段的例子表:
字段1, 字段2(字段2.1,字段2.2), 字段3 -------> 字段2可以拆分成字段2.1和字段2.2,不符合第一范式。
2. 不符合第二范式的例子表:
学号, 姓名, 年龄, 课程名称, 成绩, 学分 ---------> 这个表明显说明了两个事务:学生信息, 课程信息。
1、存在以下问题:

a、数据冗余:每条记录都含有相同信息;
b、删除异常:删除所有学生成绩,就把课程信息全删除了;
c、插入异常:学生未选课,无法记录进数据库;
d、更新异常:调整课程学分,所有行都调整。

2、修正:

a.学生表:学号, 姓名, 年龄
b.课程表:课程名称,学分
c.选课关系表:学号, 课程名称, 成绩

3.不符合第二范式的例子表:
学号, 姓名, 年龄, 所在学院,学院联系电话 ----> 其中关键字为单一关键字"学号"。存在依赖传递::(学号) → (所在学院) → (学院联系电话)

1、存在问题::

a、数据冗余:有重复值;
b、更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况
c、删除异常

2、修正:

学生表:学号, 姓名, 年龄, 所在学院;
学院表:学院, 电话

一范式就是属性不可分割。属性是什么?就是表中的字段。
不可分割的意思就按字面理解就是最小单位,不能再分成更小单位了。
这个字段只能是一个值,不能被拆分成多个字段,否则的话,它就是可分割的,就不符合一范式。
不过能不能分割并没有绝对的答案,看需求,也就是看你的设计目标而定。
举例:
学生信息组成学生信息表,有姓名、年龄、性别、学号等信息组成。
姓名不可拆分吧?所以可以作为该表的一个字段。
但我要说这个表要在国外使用呢?人家姓和名要分开,都有特别的意义,所以姓名字段是可拆分的,分为姓字段和名字段。
简单来说,一范式是关系数据库的基础,但字段是否真的不可拆分,根据你的设计目标而定。

二范式就是要有主键,要求其他字段都依赖于主键。
为什么要有主键?没有主键就没有唯一性,没有唯一性在集合中就定位不到这行记录,所以要主键。
其他字段为什么要依赖于主键?因为不依赖于主键,就找不到他们。更重要的是,其他字段组成的这行记录和主键表示的是同一个东西,而主键是唯一的,它们只需要依赖于主键,也就成了唯一的。
如果有同学不理解依赖这个词,可以勉强用“相关”这个词代替,也就是说其他字段必须和它们的主键相关。因为不相关的东西不应该放在一行记录里。
举例:
学生信息组成学生表,姓名可以做主键么?
不能!因为同名的话,就不唯一了,所以需要学号这样的唯一编码才行。
那么其他字段依赖于主键是什么意思?
就是“张三”同学的年龄和性别等字段,不能存储别人的年龄性别,必须是他自己的,因为张三的学号信息就决定了,这行记录归张三所有,不能给无关人员使用。

三范式就是要消除传递依赖,方便理解,可以看做是“消除冗余”。
消除冗余应该比较好理解一些,就是各种信息只在一个地方存储,不出现在多张表中。
比如说大学分了很多系(中文系、英语系、计算机系……),这个系别管理表信息有以下字段组成:
系编号,系主任,系简介,系架构。
那么再回到学生信息表,张三同学的年龄、性别、学号都有了,我能不能把他的系编号,系主任、系简介也一起存着?
如果你问三范式,当然不行,因为三范式不同意。
因为系编号,系主任、系简介已经存在系别管理表中,你再存入学生信息表,就是冗余了。
三范式中说的传递依赖,就出现了。
这个时候学生信息表中,系主任信息是不是依赖于系编号了?而这个表的主键可是学号啊!
所以按照三范式,处理这个问题的时候,学生表就只能增加一个系编号字段。
这样既能根据系编号找到系别信息,又避免了冗余存储的问题。

三、漫画解释三大范式

一、第一范式:
数据库的三大范式
二、第二范式:
数据库的三大范式
三、第三范式:
数据库的三大范式