数据库原理与设计学习笔记

第一讲:数据库系统概述

1.1.1 数据库的四个基本概念

数据(Data)
  1. 数据是是数据库中存储的基本对象
  2. 数据的定义:描述事物的符号记录
  3. 数据的种类:描述事物的符号可以是数字、文字、图形、图象、声音、学生的档案、处方单等。
  4. 数据特点:数据与其语义是不可分的。
  5. 数据的表现形式还不能完全表达其内容,需要经过解释。数据的含义称为数据的语义,数据与其语义是不可分的。
数据库(Database 简称DB)
  1. 定义:是长期储存在计算机内、有组织的、可共享的大量数据集合。数据库中的数据按一定的数据模型组织、描述和储存,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。
数据库管理系统(DBMS)
  1. 什么是DBMS:
    1. 位于用户与操作系统之间的一层数据管理软件
    2. 是基础软件,是一个大型复杂的软件系统
  2. 数据库管理系统的用途:科学地组织和存储数据、高效地获取和维护数据
  3. 主要功能:
    • 数据库定义功能:
      • 提供数据定义语言
      • 定义数据库中的数据对象
    1. 数据组织、存储和管理
      • 分类组织、存储和管理各种数据
      • 确定数据在存储级别上的结构和存取方式
      • 实现数据之间联系
      • 提供多种存取方法提高存取率
    2. 数据操纵功能:
      • 提供数据操纵语言
      • 实现对数据库的基本操作(查询、插入、删除和修改)
    3. 数据库的事务管理和运行管理:
      • 数据的安全性、完整性、多用户对数据的并发使用
      • 发生故障后的系统恢复数据库 由数据库管理系统统一管理和控制,保证事物正常运行
    4. 数据库的建立和维护:
      • 提供实用程序/工具
      • 完成数据库数据批量装载
      • 数据库转储、
      • 介质故障恢复
      • 数据库的重新组织和性能监视等
  4. 常见的数据库管理系统: 国外:有Microsoft公司开发的Access、SQL Server,Oracle公司开发的Oracle,Sybase 公司开发的Sybase,IBM公司开发的DB2等。 国内:中国人民大学开发的金Kingbase ES ,华中科技大学开发的DM3系统
数据库系统(DBS)
  1. 什么是数据库系统:
    1. 数据库系统(Database System,简称DBS)是指在计算机系统中引入数据库后的系统构成。
    2. 在不引起混淆的情况下常常把数据库系统简称为数据库。
  2. 数据库的系统构成:
    1. 由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员(和用户)构成。

1.1.2 数据管理技术的产生和发展

数据管理技术
  1. 什么是数据库管理技术:
    1. 对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题
    2. 数据库技术就是数据管理的技术。
    3. 数据库技术所研究的问题是如何科学地组织和存储数据,如何高效地获取和处理数据。
数据库管理技术的发展过程
人工管理阶段(40年代中–50年代中)
  • 产生背景
    • 应用需求:科学计算
    • 硬件水平:无直接存取存储设备
    • 软件水平:没有操作系统
    • 处理方式:批处理
  • 特点:
    • 数据不保存
    • 应用程序自己控制管理数据,程序员负担重
    • 无共享、冗余度极大
    • 不独立,完全依赖于程序
  • 缺点:
    • 数据冗余度大:数据面向应用,无法共享
    • 数据的不一致性
    • 数据联系弱(文件之间相互独立,缺乏联系)
文件系统阶段(50年代末–60年代中)
  • 产生背景
    • 应用需求:科学计算、管理
    • 硬件水平:有磁盘、磁鼓
    • 软件水平:有文件系统,有专门的数据管理软件
    • 处理方式:联机实时处理、批处理
  • 特点:
    • 数据以文件的形式长期保存在外存上
    • 数据的物理结构与逻辑结构有了区别
    • 文件形式多样化
    • 数据不再属于某个特定的应用,可以重复使用
      图示:数据库原理与设计学习笔记
数据库系统阶段(60年代末–现在)
  • 产生背景
    • 应用需求:大规模管理
    • 硬件水平:大容量磁盘
    • 软件水平:有数据库管理系统
    • 处理方式:联机实时处理,分布处理,批处理
  • 指导思想:对所有的数据实行统一的、集中的、独立的管理,使得数据存储独立于使用数据的程序,实现数据共享。
  • 特点:
    • 数据结构化
    • 数据的共享性高,冗余度低且容易扩充
    • 数据独立性高
    • 数据由数据库管理系统统一管理和控制
  • 数据结构化
    • 数据的整体结构化是数据库的主要特征之一。
    • 整体结构化
      • 不再仅仅针对某一个应用,而是面向全组织;
      • 不仅数据内部结构化,整体是结构化的,数据之间具有联系;
      • 数据记录可以变长;
      • 数据的最小存取单位是数据项

图示:数据库原理与设计学习笔记

三个阶段的比较

数据库原理与设计学习笔记
数据库原理与设计学习笔记

第二讲:数据模型

模型

  1. 理解:模型是对现实世界的模拟和抽象。数据模型是现实世界中数据特征的抽象。

2.1 数据模型

  • 数据模型要素:
    • 在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。通俗地讲数据模型就是现实世界的模拟。
    • 数据模型应满足三方面要求:
      • 能比较真实地模拟现实世界
      • 容易为人所理解
      • 便于在计算机上实现
  • 数据模型:
    • 数据模型的定义:数据库中的数据是按一定的方式存储在一起的,其组织结构又称为数据模型,它决定了数据库中数据之间联系的表达方式。
    • 数据模型的分类:
      • 一种是独立于计算机系统,是现实世界的抽象,也是用户和数据库设计人员交流的工具,即“概念数据模型”(信息模型) ;
      • 另一种则是直接涉及到计算机系统和数据库管理系统的数据模型,称为“基本数据模型”(逻辑模型和物理模型)。
  • 客观对象抽象的过程—— 两部抽象
    • 现实世界中的客观对象抽象为概念模型;
    • 把概念模型转换为某一DBMS支持的数据模型。

概念模型是现实世界到机器世界的一个中间层次。
数据库原理与设计学习笔记

2.2 概念模型

  • 概念模型用途
    • 概念模型用于信息世界的建模
    • 是现实世界到机器世界的一个中间层次
    • 是数据库设计的有力工具
  • 对概念模型的基本要求
    • 较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识。
    • 简单、清晰、易于用户理解。
  • 信息世界中的基本概念
    • 实体(Entity):客观存在并可相互区别的事物称为实体。可以是具体的人、事、物,也可以是抽象的概念或联系(一本书、一个学生、一个部门、一门课、学生的一次选课、部门的一次订货等都是实体。)
    • 属性(Attribute):实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。数据库原理与设计学习笔记
  • 信息世界中的基本概念
    • 码(key):唯一标识实体的属性集称为码(或者主键)。
      • 例如,学号是学生实体的码。201315121和201315122表示了两个不同的学生。
    • 实体型(Entity Type) : 用实体名及其属性名集合来抽象和刻画,同类实体称为实体型。
      • 例如,学生(学号、姓名、性别、出生日期、年龄、所学专业、电话号码、家庭住址、所在班级)就是一个实体型。
    • 实体集(Entity Set):同型实体的集合称为实体集。
      • 2013级软件技术1班的全体学生就是是一个实体集,全校的学生也是一个实体集。
    • 联系(Relationship):在现实世界中,事物内部以及事物之间是有联系的,这些联系在信息世界中反映为实体内部的联系和实体之间的联系。
      • 实体内部的联系: 是指组成实体的各属性之间的联系
      • 实体之间的联系: 通常是指不同实体集之间的联系,实体之间的联系有一对一,一对多和多对多等多种类型。
  • 描述概念模型的方法:• 目前描述概念模型最常用的方法是实体-联系(Entity-Relationship)方法,即E-R方法,使用的工具称为E-R图————E-R图所描述的现实世界的信息结构称为实体-联系模型( E-R模型)。

2.3 数据模型的组成要素

  • 数据模型是严格定义的一组概念的集合。精确地描述了系统的静态特性、动态特性和完整性约束条件 (Integrity Constraints)。
  • 数据模型由三部分组成
    • 数据结构–描述系统的静态特性
    • 数据操作–描述系统的动态特性
    • 完整性约束
  • 数据模型是对模式本身结构的抽象,模式是对数据本身结构形式的抽象。例如:
    • 关系模型:所有模式都可以抽象为表(Table)的形式(即数据结构),而每一个具体的模式都是拥有不同列名的具体的表。数据库原理与设计学习笔记

2.4 常用数据模型

  • 直接面向数据库的逻辑结构,数据库领域的主要逻辑数据模型:
    数据库原理与设计学习笔记
2.4.1 层模型
  • 层次模型用树形结构来表示各类实体以及实体间的联系
    数据库原理与设计学习笔记
  • 表示方式
    • 实体型:用记录类型描述,每个结点表示一个记录类型(实体)
    • 属性:用字段描述,每个记录类型可包含若干个字段
    • 联系:用结点之间的连线表示记录类型(实体)之间的一对多的父子联系
      数据库原理与设计学习笔记
2.4.1 网状模型
  • 网状模型与层次模型的最大区别在于两个结点之间的联系可以不唯一,因此要为每个联系命名。
  • 网状数据库系统采用网状结构(图)来表示实体及实体间的联系。数据库原理与设计学习笔记
  • 表示方式: 与层次模型相同
  • 网状模型间接表示多对多联系
  • 方法:将多对多联系分解成一对多联系
  • 引进一个学生选课的联接记录:选课(学号,课程号,成绩):表示某个学生选修某一门课程及其成绩数据库原理与设计学习笔记
2.4.1 关系模型
  • 关系数据库系统采用关系模型作为数据的组织方式 。
  • 最重要的一种数据模型,也是目前主要采用的数据模型。
  • 关系模型的数据结构
    • 在用户观点下,关系模型中数据的逻辑结构是一张二维表。数据库原理与设计学习笔记
      数据库原理与设计学习笔记
  • 优点:
    • 建立在严格的数学概念的基础上
    • 概念单一
      • 实体和各类联系都用关系来表示
      • 对数据的检索结果也是关系
    • 关系模型的存取路径对用户透明
      • 具有更高的数据独立性,更好的安全保密性
      • 简化了程序员的工作和数据库开发建立的工作
  • 缺点
    • 存取路径对用户透明,查询效率往往不如格式化数据模型
    • 为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度

第三讲:1.3 数据系统的结构

  • 从数据库应用开发人员角度看:数据库系统采用三级模式结构这是数据库系统内部的系统结构
  • 从数据库最终用户角度看数据库系统的结构有:
    • 单用户结构
    • 主从式结构
    • 分布式结构
    • 客户-服务器
    • 浏览器-应用服务器/数据库服务器
      这是数据库系统外部的体系结构

1.3.1 数据库系统模式的概念

  • 数据库系统中有“型”和“值”两个概念
    • 型(Type): 是对某一类型数据的结构和属性的说明 如:学生记录型 (学号,姓名,性别,系别,年龄,籍贯)
    • 值(value): 值是型的一个具体赋值 如:学生记录值 (201615130,李明,男,计算机系,19,江
      西南昌市)
  • 模式(Schema)
    • 是对数据库逻辑结构和特征的描述
    • 是型的描述,不涉及具体值
    • 模式是相对稳定的
  • 实例(Instance)
    • 数据库某一时刻的状态——模式的一个具体值
    • 同一个模式可以有很多实例
    • 实例随数据库中的数据的更新而变动
  • 举例:数据库原理与设计学习笔记

1.3.2 数据库系统的三级模式结构

  1. 图示:数据库原理与设计学习笔记
模式
  • 模式(也称逻辑模式)
    • 数据库中全体数据的逻辑结构和特征的描述
    • 所有用户的公共数据视图
  • 模式是数据库系统模式结构的中间层
    • 与数据的物理存储细节和硬件环境无关
    • 与具体的应用程序、开发工具及高级程序设计语言无关
  • 一个数据库只有一个模式
  • 定义模式
    • DDL以某种数据模型为基础定义数据的逻辑结构,例如数据记录由哪些数据项构成,数据项的名字、类型、取值范围等
    • 定义数据之间的联系
    • 定义与数据有关的安全性、完整性要求
外模式(External Schema)
  • 外模式(也称子模式或用户模式):是数据库用户使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。
  • 外模式与模式的关系:
    • 外模式通常是模式的子集、一个数据库模式可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求。
    • 对模式中某一数据,在不同的外模式中 结构、类型、长度、保密级别等都可以不同
  • 外模式与应用的关系:一个外模式可以为某一用户的 多个应用系统所使用,但一个应用程序只能使用一个外模式。
  • 外模式的用途:
    • 保证数据库安全性的一个有力措施
    • 每个用户只能看见和访问所对应的外模式中的数据,简化用户视图
内模式( Internal Schema)
  • 内模式(也称存储模式)
    • 是数据物理结构和存储方式的描述
    • 是数据在数据库内部的表示方式
      • 记录的存储方式(例如,顺序存储,堆存储,按属性值聚簇Cluster存储等)
      • 索引的组织方式(B+树索引,Hash索引)
      • 数据是否压缩存储
      • 数据是否加密
      • 数据存储记录结构的规定—如定长/变长,记录是否可以跨页存放等
  • 一个数据库只有一个内模式

1.3.3 数据库的二级映像功能与数据独立性

数据库原理与设计学习笔记

  • 三级模式是数据的三个抽象级别
  • 实现三个抽象层次的联系和转换
  • 数据库管理系统内部提供二级映像
    • 外模式/模式映像
    • 模式/内模式映像
      数据库原理与设计学习笔记
      数据库原理与设计学习笔记
      数据库原理与设计学习笔记