进程管理与计划任务

一、进程概念

内核的功用：进程管理、文件系统、网络功能、内存管理、驱动程序、安全功能等

Process: 运行中的程序的一个副本，是被载入内存的一个指令集合

进程ID （Process ID ，PID ）号码被用来标记各个进程

UID 、GID 、和SELinux 语境决定对文件系统的存取和访问权限，

通常从执行进程的用户来继承

存在生命周期

task struct ：Linux 内核存储进程信息的数据结构格式

task list：多个任务的的task struct 组成的链表

进程创建：

init ：第一个进程

父子关系

进程：都由其父进程创建，CoW copy on write

fork(), clone()

二、进程的优先级（时间片）

进程管理与计划任务

1.进程优先级：

系统优先级：数字越小，优先级越高

0-139 （CentOS4,5））

各有140 个运行队列和过期队列

0-98 ，99 （CentOS6））

实时优先级: 99-0 ：值最大优先级最高

nice 值：-20 到19 ，对应系统优先级100-139 或99

Big O ：时间复杂度，用时和规模的关系

O(1), O(logn), O(n) 线性, O(n^2) 抛物线, O(2^n)

实时优先级动态优先级

2.进程内存：

Page Frame: 页框，用存储页面数据，存储Page 4k

LRU ：Least Recently Used 近期最少使用算法, 释放内存物理地址空间和线性地址空间

MMU ：Memory Management Unit 负责转换线性和物理地址

TLB:Translation Lookaside Buffer 翻译后备缓冲器, 用于保存虚拟地址和物理地址映射关系的缓存

进程管理与计划任务

3.IPC: Inter Process Communication

同一主机: signal: 信号，进程与进程之间不能直接访问内存空间，

shm: shared memory 找一块共享内存空间，共享

semaphore: 信号量，一种计数器，两个进程不能同时访问，一个访问后加上lock

不同主机：rpc: remote procedure call

socket: IP和端口号套接字

三、进程状态

Linux 内核：抢占式多任务

进程类型：

守护进程: daemon, 在系统引导过程中启动的进程，和终端无关进程

前台进程：跟终端相关，通过终端启动的进程

注意：两者可相互转化

进程状态：

运行态：running

就绪态：ready

睡眠态：

可中断：interruptable

不可中断：uninterruptable

停止态：stopped, 暂停于内存，但不会被调度，除非手动启动

僵死态：zombie，结束进程，父进程结束前，子进程不关闭

四、系统管理工具

进程的分类：

CPU-Bound ：CPU 密集型，非交互

IO-Bound ：IO 密集型，交互

Linux 系统状态的查看及管理工具：pstree, ps, pidof,pgreb, top, htop, glance, pmap, vmstat, dstat, kill,pkill, job, bg, fg, nohup

（1）pstree 命令：树状结构

process 进程重（耗资源）

thread 线程轻（省内存）

（2）ps：显示当前进程的状态

Linux 系统各进程的相关信息均保存在/proc/PID 目录下的各文件中

1.支持三种选项：

UNIX 选项如如-A -e

BSD 选项如如a

GNU 选项如如--help

2.ps 当前终端打开的进程（所在终端编号）

a 所有终端中的进程

x 和终端无关（不链接）的进程，后台守护进程

u 显示进程所有者、PID、cpu、内存、VSZ、RSS 等信息

o 属性… 选项显示定制（u里的选项，所以不和u连用）的信息

pid 、comm 、%cpu 、%mem 、state 、tty 、[e]user（生效）、ruser（发起）

f 显示进程的父进程

k [/--sort] 对所选属性排序（默认是PID排序）

-C f1.sh 查看脚本信息（需#！机制，执行./）

常用组合 aux -ef

VSZ: Virtualmemory SiZe ，虚拟内存集，线性内存

RSS: ReSident Size, 常驻内存集，真实内存

3.STAT ：进程状态

R ：running

S: interruptable sleeping

D: uninterruptable sleeping

T: stopped

Z: zombie

+: 前台进程

l: 多线程进程

L ：内存分页并带锁

N ：低优先级进程

<: 高优先级进程

s: session leader 会话（子进程）发起

（3）几种优先级

ni: nice值

pri: priority 优先级

psr: processor CPU 编号

rtprio: 实时优先级

例：ps axo pid,cmd,psr,ni,pri,rtprio

1.nice 值 -20—19 ps o ni[ce]可以查看

进程优先级调整：

静态优先级：100-139

进程默认启动时的nice 值为0 ，优先级为120

只有根用户才能降低nice 值（提高优先性）

nice直接指定优先级

nice -n 优先级 cmd 例：nice -n 10 ping 127.1

renice 调整优先级

renice 优先级 PID 例：renice -10 3213 超过-20—19，用-20或19

（5）pgrep按预定义的模式查询

-u : effective user ，生效者例：pgrep -u root

-U : real user ，真正发起运行命令者例：pgrep -U root

-t terminal: 与指定终端相关的进程例：pgrep -t pts/0

-l: 显示进程名例：pgrep -l ping

-a: 显示完整格式的进程名例：pgrep -a ping

-P pid: 显示指定进程的子进程例：pgrep-P 2314

支持正则表达式例：pgrep -a"^pi.*"

按确切的程序名称：/sbin/pidof

pidof进程名查询进程名对应的进程号，如果能查询出来echo $? 为0值，查不出值为1

常用在脚本，例：

pidof httpd &> /dev/null || systemctl restarthttpd

五、进程管理工具

（1）uptime 显示当前时间，系统已启动的时间、当前上线人数，系统平均负载（1 、5 、10 分钟的平均负载，一般不会超过1）值越大，负载越大

在工作中，uptime查询，显示系统已启动的时间太长，别乱碰，机器很老，很容易故障

① 系统平均负载：

指在特定时间间隔内运行队列中的平均进程数

② 通常每个CPU 内核的当前活动进程数不大于3，那么系统的性能良好。如果每个CPU 内核的任务数大于5，那么此主机的性能有严重问题

③ 如果linux 主机是1个双核CPU，当Load Average，比内核大的超过3，不太好，为6的时候说明机器已经被充分

（2）top 默认按cpu占用率排序

1.第一行就是 uptime

第二行 tasks任务：总数在运行睡眠的 stop 僵尸态

第三行栏位信息简介：cpu dd if=/dev/zeroof=/dev/null 纯粹占用cpu，用于实验

us ：用户空间

sy ：内核空间

ni ：调整nice 时间

id ：空闲

wa ：等待IO 时间

hi ：硬中断

si ：软中断（模式切换）

st：虚拟机偷走的时间

第四行内存信息：总数空闲内存数已经占用的缓存buff

第五行swap信息：总数空闲内存数已经占用的缓存buff

dd if=/dev/zero of=/dev/null bs=3G count=1纯粹耗费swap，用于实验

2. top ：有许多内置命令（认为干预）：（打开后直接按下面的选项）

排序：

P ：以占据的CPU 百分比,%CPU（默认）

M ：占据内存百分比,%MEM

T ：累积占据CPU 时长,TIME+

首部信息显示：

uptime 信息：l 命令（是否显示）

tasks 及cpu 信息：t 命令

cpu 分别显示：1 ( 数字) （双核分开看）

memory 信息：m 命令（3中类型显示）

修改刷新时间间隔：s（默认3秒一刷新） s 10 10秒一刷新

终止指定进程：k k 进程号 kill信号例：k 4123 9

保存文件：W

退出命令：q

3.top 进去前选项

-d #：指定刷新时间间隔，默认为3秒秒

-b：全部显示所有进程

-n #：刷新多少次后退出

例：top -d 1 -n 3 一秒刷新一次，3次后退出

4.htop 更花哨的top工具，默认没有安装，需从EPEL源中安装yum -y install htop

F1 help F2 选择格式（按空格） F3搜索 F4过滤 F5显示 F6 排序 F9kill

选项：

-d #: 指定延迟时间；

-u UserName: 仅显示指定用户的进程

-s COLUME: 以指定字段进行排序

子命令：

s: 跟踪选定进程的系统调用

l: 显示选定进程打开的文件列表（包含用到的库）

a ：将选定的进程绑定至某指定CPU 核心

t: 显示进程树

六、内存工具

（1）vmstat命令：虚拟内存信息，默认显示一次就退出

① procs:

r ：可运行（正运行或等待运行）进程的个数，和核心数有关

b：处于不可中断睡眠态的进程个数( 被阻塞的队列的长度)

② memory：：

swpd: 交换内存的使用总量

free ：空闲物理内存总量

buffer ：用于buffer 的内存总量

cache ：用于cache 的内存总量

③ swap:

si ：从磁盘交换进内存的数据速率(kb/s)

so：从内存交换至磁盘的数据速率(kb/s) 测试dd if=/dev/zero of=/dev/null bs=3G count=1

④ io：

bi ：从块设备读入数据到系统的速率(kb/s) 测试dd if=/dev/sda of=/dev/null

bo: 保存数据至块设备的速率测试dd if=/dev/zeroof=/app/f1

⑤ system：：

in: interrupts 中断速率，包括时钟

cs: context switch 进程切换速率

⑥ cpu：：

us:Time spent running non-kernel code

sy: Time spent running kernel code

id: Time spent idle. Linux 2.5.41 前, 包括IO-waittime.

wa: Time spent waiting for IO. 2.5.41 前，包括in idle.

st: Time stolen from a virtual machine.2.6.11 前, unknown.

选项：

-s: 显示内存的统计数据

#：指定刷新时间间隔，并不退出例：vmstat1 一秒刷新一次

# #：指定刷新时间间隔和刷新几次例：vmstat1 10 一秒刷新一次，刷10次退出

（2） iostat: 统计CPU 和设备IO 信息

每秒钟读取多少K的数据量每秒钟写多少K的数据量总的读的数据量总的写

#：指定刷新时间间隔，并不退出例：iostat1 一秒刷新一次

# #：指定刷新时间间隔和刷新几次例：iostat1 10 一秒刷新一次，刷10次退出

（3）pmap命令：进程对应的内存映射，占用哪部分真正的内存空间

pmap [options] pid [...] 查看是否有内存泄漏问题，只存不释放，发现内存不断的增大，有问题

-x: 显示详细格式的信息

例：pmap 1

另外一种实现：（显示的差不多）

cat /proc/PID/maps 内核空间用户空间

（4）glances命令：系统监控工具

glances [-bdehmnrsvyz1] [-B bind] [-c server] [-Cconffile] [-p port] [-P password] [--password] [-t refresh] [-f file] [-ooutput]

1.内建命令：

a Sort processes automatically l Show/hide logs

c Sort processes by CPU% b Bytes or bits for network I/O

m Sort processes by MEM% w Delete warning logs

p Sort processes by name x Delete warning and critical logs

i Sort processes by I/O rate 1 Global CPU or per-CPU stats

d Show/hide disk I/O stats h Show/hide this help screen

f Show/hide file system stats t View network I/O as combination

n Show/hide network stats u View cumulative network I/O

s Show/hide sensors stats q Quit (Esc and Ctrl-C also work)

y Show/hide hddtemp stats

2.常用选项：

-b: 以Byte 为单位显示网卡数据速率

-d: 关闭磁盘I/O 模块

-f /path/to/somefile: 设定输入文件位置

-o {HTML|CSV} ：输出格式

-m: 禁用mount 模块

-n: 禁用网络模块

-t #: 延迟时间间隔

-1 ：每个CPU的相关数据单独显示

3. C/S 模式下运行glances 命令

服务器模式：

glances -s -B IPADDR

IPADDR：指明监听的本机哪个地址

客户端模式：

glances -c IPADDR

IPADDR：要连入的服务器端地址

（5）dstat命令：系统资源统计, 相对较新的命令，代替vmstat,iostat

yum install dstat -y

dstat [-afv] [options..] [delay [count]]

-c: 显示cpu 相关信息

-C #,#,...,total

-d: 显示disk 相关信息

-D total,sda,sdb,...

-g ：显示page 相关统计数据

-m: 显示memory 相关统计数据

-n: 显示network 相关统计数据

-p: 显示process 相关统计数据

-r: 显示io 请求相关的统计数据

-s: 显示swapped 相关的统计数据

--tcp

--udp

--unix

--raw

--socket

--ipc

--top-cpu ：显示最占用CPU 的进程

--top-io: 显示最占用io 的进程

--top-mem: 显示最占用内存的进程

--top-latency: 显示延迟最大的进程

七、kill命令：

1.向进程发送控制信号，以实现对进程管理, 每个信号对应一个数字，信号名称以SIG 开头（可省略），不区分大小写

显示当前系统可用信号： kill –l 或 trap -l

常用信号：man 7 signal

1) SIGHUP: 无须关闭进程而让其重读配置文件

2) SIGINT: 中止正在运行的进程；相当于Ctrl+c

3) SIGQUIT: 相当于ctrl+\

9) SIGKILL: 强制杀死正在运行的进程

15) SIGTERM ：终止正在运行的进程（默认为15）

18) SIGCONT ：继续运行

19) SIGSTOP ：后台休眠

指定信号的方法：

(1) 信号的数字标识：1, 2, 9 例：kill -1 PID

(2) 信号完整名称：SIGHUP 例：kill -SIGHUP PID

(3) 信号的简写名称：HUP 例：kill -HUP PID

2. 按进程号：

按名称：killall [-SIGNAL] com… killall -9 bash （全杀） killall httpd

按模式：pkill [options] pattern pkill -9 "bash"支持正则

-SIGNAL

-u uid: effective user 生效者 suid特殊权限

-U uid: real user ，真正发起运行命令者

-t terminal: 与指定终端相关的进程

-l: 显示进程名（pgrep 可用）

-a: 显示完整格式的进程名（pgrep 可用）

-P pid: 显示指定进程的子进程

八、作业管理

（1）Linux 的作业控制：

前台作业：通过终端启动，且启动后一直占据终端；

后台作业：可通过终端启动，但启动后即转入后台运行（释放终端）

后台作业虽然被送往后台运行，但其依然与终端相关；退出终端，将关闭后台作业。如果希望送往后台后，剥离与终端的关系

（2）查看当前终端所有作业： jobs

（3）并行运行

同时运行多个进程，提高效率

1.方法1，写进脚本

vi all.sh

f1.sh &

f2.sh &

cmd &

2.方法2

(f1.sh&);(f2.sh&);(f3.sh&)

方法3

{ f1.sh& f2.sh& f3.sh& }

{ ping -c 3 127.1 ; ping 127.2 ; }& { ping -c 3 127.3 ; ping 127.4 ; }&

九、任务计划

Linux 任务计划、周期性任务执行

未来的某时间点执行一次任务

batch ：系统自行选择空闲时间去执行此处指定的任务

周期性运行某任务周期性的备份，清理

cron

（1）at

1.安装确保服务启动

rpm -ql at 看到有servie，就想到查询服务是否开启

centos 7

systemctl status atd[.service] 查询服务状态

systemctl start atd 开启服务

centos 6

service atdstatus

service atd start

2.at 命令：at [option] TIME

① 常用选项：队列信息的配置文件在 /var/spool/at目录下

-V 显示版本信息:

-l：列出指定队列中等待运行的作业；相当于atq 例：at -l

-d #：删除指定的作业；相当于atrm

-c #：查看具体作业任务例：at -c 1

-f路径：从指定的文件中读取任务例：at -f at.txt 12:12

-m: 当任务完成后，即使没有标准输出也强制发邮件

因为是交互式的，所以可以事先把计划任务写到脚本里，再用管道实现非交互，<，-f

cat at.log |at 12:12

at 写完任务按Ctrl +d 退出

注意：作业执行命令的结果中的标准输出和错误以邮件通知给相关用户，为了减少生成垃圾邮件，可以加上 &> /dev/null

② TIME: 定义出什么时候进行 at 这项任务的时间

HH:MM [YYYY-mm-dd]

noon（12:00）, midnight（00:00）, teatime （4pm）

tomorrow

now+#{minutes,hours,days,OR weeks}

at 时间格式

HH:MM 在今日的 HH:MM 进行，若该时刻已过，则明天此时执行任务

HH:MM YYYY-MM-DD 02:00 2016-09-20 规定在某年某月的某一天的特殊时刻进行该项任务

HH:MM[am|pm] [Month] [Date] 例：04pm March 例：17:20 tomorrow

HH:MM[am|pm] + number [minutes|hours|days|weeks] 在某个时间点再加几个时间后才进行该项任务

例：now + 5 minutes

02pm + 3 days

③ 执行方式：

1）交互式 2）输入重定向例：at12:12: 2017-12-12 < at.txt 3）at –f 文件

依赖与atd 服务, 需要启动才能实现at 任务
at 队列存放在/var/spool/at目录中，所以重启仍在
/etc/at.{allow,deny} 控制用户是否能执行at 任务

白名单：/etc/at.allow 默认不存在

黑名单：/etc/at.deny 默认存在，拒绝该文件中用户执行at 命令

如果两个文件都不存在有，只有 root 行可以执行 at

有allow > deny，allow优先级最大

没at.allow，at.deny只有root才有权限执行at

没allow有deny deny中用户不能执行，其他用户默认允许

有allow有deny 只有allow中用户才能执行

（2）cron

1.相关的程序包：（默认都安装了）

cronie: 主程序包，提供crond 守护进程及相关辅助工具

cronie-anacron ：cronie 的补充程序，用于监控cronie任务执行状况，如cronie 中的任务在过去该运行的时间点未能正常运行，则anacron 会随后启动一次此任务

crontabs ：包含CentOS 提供系统维护任务

rpm -ql cronie 和 at 一样

CentOS 7:

systemctl status crond

CentOS 6:

service crond status

2.系统cron 任务：系统维护作业 /etc/crontab（只有root才有权限）

用户cron 任务： crontab 命令

日志：/var/log/cron

① 系统cron 任务:/etc/crontab

详情参见 man 5 crontab

② 时间表示法：

特定值给定时间点有效取值范围内的值

* 给定时间点上有效取值范围内的所有值，表示“每...”

离散取值 #,#,#

连续取值 #-#

在指定时间范围上，定义步长 /#: #

③ 时间格式

@reboot Run once after reboot.

@yearly 0 0 1 1 *

@annually 0 0 1 1 *

@monthly 0 0 1 * *

@weekly 0 0 * * 0

@daily 0 0 * * *

@hourly 0 * * * *

系统的计划任务:

/etc/cron.d 目录 vim /etc/cron.d/0hourly

/etc/cron.d/ 配置文件

/etc/cron.hourly/ 脚本

/etc/cron.daily/ 脚本

/etc/cron.weekly/ 脚本

/etc/cron.monthly/ 脚本

date -d "yesterday" +%F 创建昨天的时间的文件

date -d "-2 day" +%F 创建前天的时间的文件 date -d "-/+# day" +%F

3.用户cron

crontab 命令定义，每个用户都有专用的cron 任务文件：

/var/spool/cron/USERNAME

crontab命令：

相当于vi 打开的，没有颜色，export EDITOR=vim 用vim打开，写到配置文件/etc/profile.d/*.sh

crontab [-u user] [-l | -r | -e] [-i]

-l: 列出所有任务；

-e: 编辑任务；改任务 crontab -e 写自己的计划任务

-r: 移除所有任务；

-i ：同-r 一同使用，以交互式模式移除指定任务

-u user: 仅root 可运行，指定用户管理cron 任务

例：su - wang crontab -e

控制用户执行计划任务：

/etc/cron.{allow,deny}

有allow > deny，allow优先级最大

没at.allow，at.deny只有root才有权限执行at

没allow有deny deny中用户不能执行，其他用户默认允许

有allow有deny 只有allow中用户才能执行

注意：对于cron 任务来讲，% 有特殊用途；如果在命令中要使用%，，则需要转义，将%

4.秒级 sleep 0.5 支持小数点 usleep 以微秒为单位 10^6微秒为 1秒

* * * * * root ls;sleep 20;pwd;sleep 20;...

4.anacron 系统，运行计算机关机时cron不运行的任务，因为企业不常关机，所有不常用

运行计算机关机时cron不运行的任务，CentOS6 以后版本取消anacron 服务，由crond 服务管理

对笔记本电脑、台式机、工作站、偶尔要关机的服务器及其它不一直开机的系统很重要对很有用

配置文件：/etc/anacrontab ，负责执行/etc/ cron.daily/etc/cron.weekly /etc/cron.monthly 中系统任务。

字段1 ：如果在这些日子里没有运行这些任务……

字段2 ：在重新引导后等待这么多分钟后运行它

字段3 ：任务识别器，在日志文件中标识

字段4 ：要执行的任务

由/etc/cron.hourly/0anacron 执行

当执行任务时，更新/var/spool/anacron/cron.daily 文件的时间戳

5.定时清除临时文件

CentOS6 使用/etc/cron.daily/tmpwatch 定时清除临时文件

CentOS7 使用systemd-tmpfiles-setup 服务实现

配置文件：

/etc/tmpfiles.d/*.conf

/run/tmpfiles.d/*.conf

/usr/lib/tmpfiles/*.conf

/usr/lib/tmpfiles.d/tmp.conf

d /tmp 1777 root root 10d

d /var/tmp 1777 root root 30d

命令：

systemd-tmpfiles –clean|remove|createconfigfile

转载于:https://blog.51cto.com/13017865/1966019

进程管理与计划任务

相关推荐