操作系统 -- 进程管理(二)

操作系统 – 进程管理(二)

1. 前言

操作系统是我们计算机专业需要掌握的一门课程,由于操作系统较为难以理解,因此我将操作系统知识点进行整理。

我主要将操作系统分为5个大知识点进行整理:

  1. 计算机系统概述
  2. 进程管理
  3. 内存管理
  4. 文件管理
  5. IO外设管理

本篇博客就是对进程管理进行知识点解析。

2. 进程管理 – 进程定义、组成、状态、特征

程序段、数据段、PCB三部分组成了进程实体(进程映像)。一般情况下,我们把进程实体就简称为进程。例如,所谓创建进程,实质上是创建进程实体中的PCB。而撤销进程,实质上是撤销进程实体中的PCB。我们需要注意的是:PCB是进程存在的唯一标识

引入了进程实体的概念后,我们可以把进程定义为:

进程是进程实体的运行过程,是系统进行资源分配调度的一个独立单位。严格来说,进程实体和进程不一样,进程实体是静态的,进程则是动态的

那么PCB具体是什么呢,有什么作用呢,我们来看看。

PCB的作用:

  • 进程描述信息
    • 进程标识符PID
    • 用户标识符UID
  • 进程控制和管理信息
    • 进程当前状态
    • 进程优先级
  • 资源分配清单
    • 程序段指针
    • 数据段指针
    • 键盘
    • 鼠标
  • 处理机相关信息
    • 各种寄存器

在一个系统中,通常由数十、数百乃至数千个PCB。为了能对它们加以有效的管理,应该用适当的方式把这些PCB组织起来,因此引入了进程组织的概念。

进程的组织一般有两种方式:链接方式(按照进程状态将PCB分为多个队列,操作系统持有指向各个队列的指针)、索引方式(根据进程状态的不同、简历几张索引表,操作系统持有指向各个索引的指针)。

了解了什么是进程,我们来看看进程有哪些特征

  • 动态性:进程是程序的一次执行过程,是动态产生、变化和消亡的。
  • 并发性:内存中有多个进程实体,各进程可并发执行。
  • 独立性:进程是能独立运行、独立获得资源、独立接受调度的基本单位。
  • 异步性:各进程按各自独立的、不可预知的速度向前推进,操作系统要提供“进程同步机制”来解决异步问题。
  • 结构性:每一个进程都会配置一个PCB。结构上看,进程由程序段、数据段PCB组成。

进程因为是动态的,因此它是由状态的,一般有五种状态:

  • 运行态:占有CPU,并在CPU上运行。我们需要知道,在单核处理机环境下,每一时刻最多只有一个进程处理运行态。
  • 就绪态:已经具备运行条件,但由于没有空闲CPU,而暂时不能运行。即进程已经拥有了除处理及之外所有需要的资源,一旦获得处理机,即可立即进入运行状态开始运行。
  • 阻塞态:因等待某一事件而暂时不能运行。例如等待操作系统分配打印机、等待读磁盘操作的结果。CPU是计算机中最昂贵的部件,为了提高CPU的利用率,需要先将其他进程的资源分配到位,才能得到CPU的服务。
  • 创建态:进程正在被创建,操作系统为进程分配资源、初始化PCB。
  • 终止态:进程正在从系统中撤销,操作系统会回收进程拥有的资源、撤销PCB。

3. 进程管理 – 进程控制

进程控制的主要功能是对系统中的所有进程设施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。

那么是用什么实现进程控制的呢,原语的特点是执行期间不允许中断,这种不可被中断的操作即为原子操作。原语采用“关中断指令”和“开中断指令”实现。显然,这两个指令权限非常大,必然只允许在核心态下执行特权指令

。。。。。。
关中断指令
原语代码1
原语代码2
开中断指令
代码3
代码4
。。。。。。

而原语也分很多类型。例如:

进程的创建:使用创建原语,申请空白PCB,为新进程分配所需资源,初始化PCB,将PCB插入就绪队列。

进程的终止:使用撤销原语,从PCB集合中找到终止进程的PCB,若进程正在运行,立即剥夺CPU,将CPU分配给其他进程,终止其所有子进程。将该进程拥有的所有资源归还给父进程或操作系统,删除PCB。

进程的阻塞和唤醒:使用阻塞原语(找到要阻塞的进程对应的PCB,保护进程运行现场,将PCB状态的信息设置为“阻塞态”,暂时停止进程运行,将PCB插入相应事件的等待队列)唤醒原语(在事件等待队列中找到PCB,将PCB从等待队列中移除,设置进程为就绪,将PCB插入就绪队列,等待被调度)

进程的切换:使用切换原语,将运行环境信息存入PCB,PCB移入相应队列,选择另一个进程执行,并更新其PCB,根据PCB恢复新进程所需的运行环境。

4. 进程管理 – 进程通信

什么是进程通信?顾名思义,进程通信就是指进程之间的信息交换

进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立

为了保证安全,一个进程不能直接访问另一个进程的地址空间。但是进程之间的信息交换又是必须的。为了保证进程间的安全通信,操作系统提供了一些方法:共享存储消息传递管道通信

首先来了解下共享存储:即多个进程共享同一块内存空间,但是对共享空间的访问必须是互斥的。主要分为基于数据结构的共享(比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式)、基于存储区的共享(在内存中画出一块共享存储区,数据的形式、存放位置都有进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式)。

操作系统 -- 进程管理(二)

其次是了解下管道通信:管道只能采用半双工通信,某一时刻内只能是心啊单向的传输。如果要实现双向同时通信,则需要设置两个管道。并且各进程要互斥地访问管道。数据以字符流的形式写入管道,当管道写满时,写进程的write()系统调用会被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()系统调用将被阻塞如果没写满,就不允许读。如果没读空,就不允许写。数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则会有读错数据的情况。

操作系统 -- 进程管理(二)

最后还有一种就是消息传递:进程间的数据交换以格式化的信息为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。分为直接通信方式(消息直接挂到接收进程的消息缓冲队列上)间接通信方式(消息要先发送到中间实体中,也称信箱通信方式)

操作系统 -- 进程管理(二)

5. 进程管理 – 线程

什么是线程?线程可以理解为“轻量级进程”。线程是一个基本的CPU执行单元,也是程序执行流的最小单元。引入线程后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务。引入线程后,进程只作为除CPU之外的系统资源的分配单元

总和来讲,引入线程后有三大变化:

  • 资源分配、调度:传统进程机制中,进程是资源分配、调度的基本单位。引入线程后,进程是资源分配的基本单位,线程是调度的基本单位。
  • 并发性:传统进程机制中,只能进程间并发。引入线程后,各线程间也能并发,提高了并发度。
  • 系统开销:传统的进程间并发,需要切换进程的运行环境,系统开销很大。引入线程后,线程间并发,如果是同一进程内线程切换,则不需要切换进程环境,系统开销小。

上面我们了解了进程的属性,那么线程也是有自己的属性的:

  1. 线程是处理机调度的单位
  2. 多CPU计算机中,各个线程可占用不同的CPU
  3. 每个线程都有一个线程ID、线程控制块TCB
  4. 线程也有就绪、阻塞、运行三种基本状态
  5. 线程几乎不拥有系统资源
  6. 同一进程的不同线程之间共享进程的资源
  7. 由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预
  8. 同一进程中的线程切换,不会引起进程切换
  9. 不同进程中的线程切换,会引起进程切换
  10. 切换同进程内的线程,系统开销很小
  11. 切换进程,系统开销很大

线程的实现方式

用户级线程:用户级线程由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责。用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。在用户看来是有多个线程,但在操作系统看来,并意识不到线程的存在。可以这样理解:用户级线程就是从用户角度看能看到的线程

内核级线程:内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然要在核心态下才能完成。可以这样理解:内核级线程就是从操作系统内核视角看到的线程

多线程模型

多对一模型:多个用户及线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。

操作系统 -- 进程管理(二)

一对一模型:一个用户及线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

操作系统 -- 进程管理(二)

多对多模型:n用户及线程映射到m各内核级线程(n>=m)。每个用户进程对应m个内核级线程。克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。

操作系统 -- 进程管理(二)

6. 进程管理 – 进程调度

调度的基本概念

当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则决定处理这些任务的顺序,这就是“调度”研究的问题。

在多道程序系统中,进程的数量往往是多于处理及的个数的,这样不可能同时并行处理各个进程。处理机调度,这就是从就绪队列中按照一定的算法选择一个进程并将处理机分配给它运行,以实现进程的并发运行。

调度的三个层次 – 高级调度

由于内存空间有限,有时无法将用户提交的作业全部放入内存,因此就需要确定某种规则来决定
将作业调入内存的顺序。高级调度(作业调度),按一定的原则从外存上处于后备队列的作业中挑选一个(或多个)作业,给他们分配内存等必要资源,并建立相应的进程( 建立PCB),以使它(们)获得竞争处理机的权利。高级调度是辅存(外存)与内存之间的调度。每个作业只调入一次,调出一次。作业调入时会建立相应的PCB,作业调出时才撤销PCB。高级调度主要是指调入的问题,因为只有调入的时机需要。操作系统来确定,但调出的时机必然是作业运行结束才调出。

调度的三个层次 – 中级调度

引入了虚拟存储技术之后,可将暂时不能运行的进程调至外存等待。等它重新具备了运行条件且
内存又稍有空闲时,再重新调入内存。这么做的目的是为了提高内存利用率和系统容吐量。暂时调到外存等待的进程状态为挂起状态。值得注意的是,PCB并不会一 起调到外存, 而是会常驻内存。PCB中会记录进程数据在外存中的存放位置,进程状态等信息,操作系统通过内存中的PCB来保持对各个进程的监控、管理。被挂起的进程PCB会被放到的挂起队列中。中级调度(内存调度),就是要决定将哪个处于挂起状态的进程重新调入内存。一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高

调度的三个层次 – 低级调度

低级调度(进程调度),其主要任务是按照某种方法和策略从就绪队列中选取-一个进程,将处理
机分配给它。进程调度是操作系统中最基本的一种调度,在一般的操作系统中都必须配置进程调度。进程调度的频率很高,一般几十毫秒一 次。

要做什么 调度发生在 发生频率 对进程状态的影响
高级调度(作业调度) 按照某种规则,从后备队列中选择合适的作业将其调入内存,并为其创建进程 外存->内存 最低 无->创建态->就绪态
中级调度(内存调度) 按照某种规则,从挂起队列中选择合适的进程将其数据调回内存 外存->内存 中等 挂起态->就绪态
低级调度(进程调度) 按照某种规则,从就绪队列中选择一个进程为其分配处理机 内存->CPU 最高 就绪态->运行态

调度的方式

**非剥夺调度方式,又称非抢占方式。**即只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态。

**剥夺调度方式,又称抢占方式。**当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更紧迫的哪个进程。

调度的算法

  1. 先来先服务(FCFS):此算法的原则是按照作业到达后备作业队列(或进程进入就绪队列)的先后次序选择作业(或进程)。
  2. 短作业优先(SJF:Shortest Process First):这种算法主要用于作业调度,它从作业后备序列中挑选所需运行时间最短的作业进入主存运行。
  3. 时间片轮转调度算法:当某个进程执行的时间片用完时,调度程序便终止该进程的执行,并将它送到就绪队列的末尾,等待分配下一时间片再执行。然后把处理机分配给就绪队列中新的队首进程,同时也让它执行一个时间片。这样就可以保证队列中的所有进程,在已给定的时间内,均能获得一时间片处理机执行时间。
  4. 高响应比优先:按照高响应比(已等待时间+要求运行时间)/要求运行时间 优先的原则,在每次选择作业投入运行时,先计算此时后备作业队列中每个作业的响应比RP。选择最大的作业投入运行。
  5. 优先权调度算法:按照进程的优先权大小来调度。使高优先权进程得到优先处理的调度策略称为优先权调度算法。注意:优先数越多,优先权越小。
  6. 多级队列调度算法:多队列调度是根据作业的性质和类型的不同,将就绪队列再分为若干个队列,所有的作业(进程)按其性质排入相应的队列中,而不同的就绪队列采用不同的调度算法。

7. 进程管理 – 死锁

在并发环境下,各进程因竞争资源而造成的一种互相等待对方手里的资源,导致各进程都阻塞,都无法向前推进的现象,就是“死锁”。发生死锁后若无外力干涉,这些进程都将无法向前推进。

死锁、饥饿、死循环的区别

死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象。

饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。比如:在短进程优先(SPF) 算法
中,若有源源不断的短进程到来,则长进程将一直得不到处理机, 从而发生长进程“饥饿”。

死循环:某进程执行过程中- -直跳不出某个循环的现象。有时是因为程序逻辑bug导致的,有时是
程序员故意设计的。

产生死锁的条件

产生死锁必须同时满足一下四个条件,只要其中任一条件不成立,死锁就不会发生。

互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)。

不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放。

请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放。

循环等待条件:存在-种进程资源的循环等待链,链中的每一个进程己获得的资源同时被下一个进程所请求。

死锁处理策略

预防死锁:破坏死锁产生的四个必要条件中的一一个或几个。

避免死锁:用某种方法防止系统进入不安全状态,从而避免死锁( 银行家算法)。

死锁的检测和解除:允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措
施解除死锁。

8. 小结

以上都是对进程管理的描述,主要讲了进程的定义、进程控制、进程通信、线程、进程调度、死锁

下一篇我们来了解内存管理的部分内容。