linux中进程控制和进程调度(包含一些面试基础题)
进程控制
进程和程序:
程序是存放在磁盘上的一系列代码和数据的可执行映像,是一个静止的实体。
进程是一个执行中的程序。它是动态的实体。
进程和线程的区别:
进程是资源分配的最小单位,线程是调度的最小单位。在linux系统中,进程有独立的用户空间,如果没有独立的用户空间,但是有用户空间,是用户进程;如果没有独立的用户空间,也没有用户空间,则是内核进程。(下边的一张图)
进程的四要素
- 有一段程序供其运行。这段程序不一定是某个进程所专有,可以与其他进程共用。
- 进程有专有的内核空间堆栈。
- 在内核中有一个task_struct 数据结构,即通常说的“进程控制块”。有了这个数据结构,进程才能成为内核调度的一个基本单位接受内核调度。
- 有独立的用户空间。
进程的描述:
在linux系统中,线程、进程都使用struct task_struct 来表示,它包含大量描述进程/线程的信息,比较重要的有: - pid_t pid ;进程号
-
volatile long state : 进程状态
TASK_RUNNING
进程正在被CPU执行,或者已经准备就绪,随时可执行。当一个进程刚被创建时,就处于TASK_RUNNING状态。
TASK_INTERRUPTIBLE
处于等待中的进程,待等待条件为真时被唤醒,也可以被信号或者中断唤醒。
TASK_UNINTERRUPTIBLE
处于等待中的进程,待资源有效时唤醒,但不可以有其他进程通过信号(signal)或中断唤醒。
TASK_STOPPED
进程中止执行,当接收到SIGSTOP或SIGTSTP等信号时,进程进入该状态,接收到SIGCONT信号后,进程重新回到TASK_RUNNING
TASK_KILLABLE
linux2.6.25新引入的进程睡眠状态,原理类似于TASK_UNINTERRUPTIBLE,但是可以被致命信号(SIGKILL)唤醒。
TASK_TRACED
正处于被调试状态的进程。
TASK_DEAD
进程退出时(调用do_exit),state字段被设置成该状态。 -
int exit_state :进程退出时的状态
EXIT_ZOMBIE(僵死进程)
表示进程的执行被终止,但是父进程还没有发布waitpid()系统调用来收集有关死亡进程的信息。
EXIT_DEAD(僵死撤销状态)
表示进程的最终状态。父进程已经使用wait4()或waitpid()系统调用收集了信息,因此进程将由系统删除。 - *struct mm_struct mm :进程用户空间描述指针,内核线程该指针为空。
- unsigned int policy:该进程的调度策略
- int prio:优先级
- int static_prio:静态优先级
-
struct sched_rt_entity rt:
rt->time_slice:时间片,进程的缺省时间片与进程的静态优先级相关,使用如下公式得出:
MIN_TIMESLICE+((MAX_TIMESLICE-MN_TIMESLICE)*(MAX_PRIO-1-§->static_prio)/(MAX_USER_PRIO-1))
task_struct 位置(2.4)
task_struct 位置(2.6)
Current
在linux中用 current 指针指向当前正在运行的进程的 task_struct
进程的创建
进程销毁
进程销毁可以通过几个事件驱动——通过正常的进程结束、通过信号或是通过对 exit 函数的调用。不管进程如何退出,进程的结束都要借助对内核函数 do_exit 的调用。
进程调度
首先要明白:什么是调度?
从就绪的进程中选出最适合的一个来执行。
调度策略
- SCHED_NORMAL(SCHED_OTHER):普通的分时进程
- SCHED_FIFO:先入先出的实时进程
- SCHED_RR:时间片轮转的实时进程
- SCHED_BATCH:批处理进程
- SCHED_IDLE:只在系统空闲时才能够被调度执行的进程。
调度类
调度类的引入增强了内核调度程序的可扩展性,这些类(调度程序模块)封装了调度策略,并将调度策略模块化。
- CFS调度类(在 kernel/sched_fair.c 中实现)用于以下调度策略:SCHED_NORMAL,SCHED_BATCH和SCHED_IDLE
-
实时调度类(在 kernel/sched_rt.c 中实现)用于SCHED_RR和SCHED_FIFO策略。
调度类的结构:
调度时机
调度什么时候发生?即:schedule()函数什么时候被调用?
调度的发生有两种方式:
-
主动式
在内核中调用schedule()。当进程需要等待资源等而暂时停止运行时,会把状态置于挂起(睡眠),并主动请求调度,让出CPU。
举例:主动放弃cpu例:
current->state = TASK_INTERRUPTIBLE;
schedule();
-
被动式(抢占)
一、 用户抢占(linux2.4 、linux2.6)
二、内核抢占(linux2.6)
一、用户抢占发生在:
(1)从系统调用返回用户空间
(2)从中断处理程序返回用户空间
内核即将返回用户空间的时候,如果 need_resched 标志被设置,会导致 **schedule()**被调用,此时就会发生用户抢占。
二、内核抢占
在不支持内核抢占的系统中,进程/线程一旦运行于内核空间,就会一直执行,知道它主动放弃或时间片耗尽为止。这样一些非常紧急的进程或线程将长时间得不到运行。
在支持内核抢占的系统中,更高优先级的进程/线程可以抢占正在内核空间运行的 低优先级进程/线程。
某些特例是 不允许内核抢占的:
- 内核正进行中断处理。进程调度函数 schedule()会对此作出判断,如果是在中断中调用,会打印出错信息。
- 内核正在进行中断上下文的Bottom Half(中断的底半部)处理。硬件中断前会执行软中断,此时仍然处于中断上下文中。
- 进程正持有spinlock自旋锁、writelock/readlock读写锁等,当持有这些时,不应该被抢占,否则由于抢占将导致其他CPU长期不能获得锁而死等。
- 内核正在执行调度程序Scheduler。抢占的原因就是为了进行新的调度,有理由将调度程序抢占掉再运行调度程序。
为保证LINUX内核在以上情况下不会被抢占,抢占内核使用了一个变量preempt_count,称为内核抢占计数。该变量设置在thread_info结构中。进入以上情况时加1,退出时减1.
内核抢占可能发生在:
- 中断处理程序完成,返回内核空间之前
- 当内核代码再一次具有可抢占性的时候,如解锁及使能软中断等。
调度标志(TIF_NEED_RESCHED)
**作用:**内核提供一个need_resched标志来表明是否需要重新执行一次调度。
设置:
- 当某个进程耗尽它的时间片时,会设置这个标志;
- 当一个优先级更高的进程进入可执行状态的时候,也会设置这个标志。
调度步骤
schedule函数工作流程如下:
- 清理当前运行中的进程
- 选择下一个要运行的进程(pick_next_test分析)
- 设置新进程的运行环境
- 进程上下文切换