例如：有个文件test的内容如下：
ert
fff
**
[abcfd]
123
324
444
[rty]
**
fgfgf
怎么能截取
[abcfd]
123
324
444
[rty]
这一部分出来呢？

答案： sed -n '/\[abcfd\]/,/\[rty\]/p' test

第九章正则扩展内容预习加课堂笔记

sed中，使用\u表示大写，\l表示小写

1. 把每个单词的第一个小写字母变大写：
sed 's/\b[a-z]/\u&/g' filename

sed 's/\b[a-z]/\u&/g' 2.txt

第九章正则扩展内容预习加课堂笔记

2. 把所有小写变大写：

sed 's/[a-z]/\u&/g' 2.txt

第九章正则扩展内容预习加课堂笔记

3. 大写变小写：

sed 's/[A-Z]/\l&/g' 2.txt 是小写 L

第九章正则扩展内容预习加课堂笔记

sed在文件中某一行最后添加一个数字

sed 's/$^a.*$/\1 12/' 2.txt 不加选项-r，用 \ 做脱义

第九章正则扩展内容预习加课堂笔记

sed删除某关键字的下一行到最后一行

sed '/c/{p;:a;N;$!ba;d}' 3.txt

[[email protected] ~]# cat test
a
b
c
d
e
f
[[email protected] ~]# sed '/c/{p;:a;N;$!ba;d}' test
a
b
c

定义一个标签a，匹配c，然后N把下一行加到模式空间里，匹配最后一行时，才退出标签循环，然后命令d，把这个模式空间里的内容全部清除。

if 匹配"c"
:a
追加下一行
if 不匹配"$"
goto a
最后退出循环，d命令删除。

由上，我们可以通过sed删除匹配行以及匹配行下一行
sed -i '/sample/{N;d}' filename

//sample是匹配字符，N在这里就是下一行，d是删除

sed '/c/{p;:a;N;$!ba;d}' 3.txt

第九章正则扩展内容预习加课堂笔记

如何使用sed打印1到100行包含某个字符串的行

sed -n '1,100{/abc/p}' 2.txt

第九章正则扩展内容预习加课堂笔记

awk 中使用外部shell变量

如：
A=44echo "ABCD" | awk -v GET_A=$A ’{print GET_A}’
说明：-v选项用于定义参数，这里表示将变量A的值赋予GET_A。
有多少个变量需要赋值，就需要多少个-v选项。与之等价的：应用于脚本中：

#! /bin/bash
sort -n filename |awk -F ':' '{print $1}'|uniq >id.txt
for id in `cat id.txt`; do
echo "[$id]"
awk -v id2=$id -F ':' '$1==id2 {print $2}' filename // 另外的方式为: awk -F ':' '$1=="'id'" {print $2}' filename
done
附件：
cat filename
1111111:13443253456
2222222:13211222122
1111111:13643543544
3333333:12341243123
2222222:12123123123
运行脚本后结果为：
[1111111]
13443253456
13643543544
[2222222]
13211222122
12123123123
[3333333]
12341243123

awk 合并一个文件

我有这样的需求，需要把两个文件中，第一列相同的行合并到同一行中。举个例子，有两个文件，内容如下

cat 1.txt

1 aa
2 bb
3 ee
4 ss

cat 2.txt

1 ab
2 cd
3 ad
4 bd
5 de

合并后的结果为：

1 ab aa
2 cd bb
3 ad ee
4 bd ss
5 de

实现的命令为：

awk 'NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}' 1.txt 2.txt

解释：NR表示读取的行数， FNR表示读取的当前行数，大家可以运行这个命令 awk '{print NR,FNR}' 1.txt 2.txt，比较NR和FNR

所以其实NR==FNR 就表示读取1.txt的时候。同理NR>FNR表示读取2.txt的时候

数组a其实就相当于一个map

把一个文件多行连接成一行

a=`cat file`;echo $a
awk '{printf("%s ",$0)}' file // %s 后记得要有一空格，否则出来就是完全连在一起的，中间连空格都没有
cat file |xargs

应用举例：一个文件每行都有一个数字，现在需要把每行的数字用“+”连接起来。
cat a
96
1093
1855
1253
1364
1332
2308
2589
2531
1239
2164
2826
2787
2145
2617
4311
1810
2115
1235

awk '{printf ("%s+",$0)}' a; echo ""
96+1093+1855+1253+1364+1332+2308+2589+2531+1239+2164+2826+2787+2145+2617+4311+1810+2115+1235+
这里注意，最后一个是带“+”的。echo "" 的作用是换行。

另外的方法是
cat a|xargs|sed 's/ /+/g'
96+1093+1855+1253+1364+1332+2308+2589+2531+1239+2164+2826+2787+2145+2617+4311+1810+2115+1235

awk 截取指定多个域为一行

用awk指定分隔符把文本分为若干段。如何把相同段的内容弄到一行？

以/etc/passwd为例，该文件以":"作为分隔符，分为了7段。

for i in `seq 1 7`

awk -F ':' -v a=$i '{printf $a " "}' /etc/passwd

echo

done

grep 或 egrep 或awk 过滤两个或多个关键词

grep -E '123|abc' filename // 找出文件（filename）中包含123或者包含abc的行
egrep '123|abc' filename //用egrep同样可以实现
awk '/123|abc/' filename // awk 的实现方式

awk用print打印单引号

比较绕，不用死记硬背，以后用的时候，稍微多试几次就出来了。

awk 'BEGIN{print "a'"'"'s"}' //不用脱义，就多写几个单引号、双引号

awk 'BEGIN{print "a'\''s"}' //用脱义，脱义的是单引号

awk 'BEGIN{print "a\"s"}' //用脱义，脱义的是双引号

把两个文件中相同的行合并成一行

paste  filename1  filename2

这样就可以实现了。举个例子。
cat  a.txt
1 2 3
4 5 6
a b c

cat b.txt
3 2 1
6 5 4
c b a

则  paste  a.txt  b.txt  结果为
1 2 3 3 2 1
4 5 6 6 5 4
a b c c b a

如果，你想在两个文件连接处用一个指定的字符连接，还可以用-d来指定
paste -d '+'  a.txt b.txt
结果为
1 2 3+3 2 1
4 5 6+6 5 4
a b c+c b a

awk

awk语法结构：

awk -F ':' 'BEGIN{语句} {if(条件){语句1;语句2;语句3} } END{语句}' filename

将passwd文件打印第一段

1、[[email protected]128 awk]# awk -F ':' '{print $1}' passwd

root bin daemon adm lp sync shutdown halt mail operator games ftp nobody .........

将passwd文件打印所有段

$0表示所有,也可以将-F ‘:’去掉

awk -F ':' '{print $0}' passwd ==awk '{print $0}' passwd ==cat passwd

2、[root@linux7-128 awk]# awk -F ':' '{print $0}' passwd

注意：

如果awk忽略了-F，默认将会以空格、空白字符为分隔符去打印

打印多段

awk -F ‘:’ ‘{print [Math Processing Error]3,$5}’ passwd

3、[[email protected] awk]# awk -F ':' '{print $1,$3,$5}'

指定字符分割，不用空格，例如使用#

4、[[email protected]128 awk]# awk -F ':' '{print $1"#"$3"#"$5}' passwd

root#0#root bin#1#bin daemon#2#daemon adm#3#adm lp#4#lp sync#5#sync shutdown#6#shutdown halt#7#halt mail#8#mailoperator#11#operatorgames#12#games ...........

匹配含有oo的行

5、[[email protected] awk]# awk '/oo/' passwd

匹配含有oo的第一段

6、[[email protected] awk]# awk -F ':' '$1 ~ /oo/' passwd

支持正则

7、[[email protected] awk]# awk -F ':' '$1 ~ /oo+/' passwd

多个表达式一起写

awk -F ‘:’ ‘/root/ {print [Math Processing Error]3} /huhu/ {print [Math Processing Error]3}’ passwd ==

awk -F ‘:’ ‘/root|huhu/ {print [Math Processing Error]3}’ passwd

8、[[email protected]128 awk]# awk -F ':' '/root/ {print $1,$3} /huhu/ {print $1,$3}' passwd

数学符号 >、<、==、、、

第三段等于0的

9、[[email protected] awk]# awk -F ':' '$3==0 {print $0}' passwd

第三段大于1000的

10、[[email protected] awk]# awk -F ':' '$3>=1000 {print $0}' passwd

双引号的含义

11、[[email protected] awk]# awk -F ':' '$3>="1000" {print $0}' passwd

加上双引号”“之后，相当于sort不加-n。就代表1000不再是数字，而是一个字符串，是以ASSIC码计算的。

第七段的值不等于/sbin/nologin

12、[[email protected] awk]# awk -F ':' '$7!="/sbin/nologin" {print $0}' passwd

字段之间相互比较

字段3小于字段4的

13、[root@linux7-128 awk]# awk -F ':' '$3<$4 {print $0}' passwd

字段3大于5并且小于7 &&,加上双引号之后是用ASSIC码比较的

14、[root@linux7-128 awk]# awk -F ':' '$3>"5" && $3<"7" {print $0}' passwd

字段3大于950或者字段7等于/bin/bash ||

15、[root@linux7-128 awk]# awk -F ':' '$3>950 || $7=="/bin/bash" {print $0}' passwd

OFS

指定打印后的分隔符

16、[root@linux7-128 awk]# awk -F ':' '{OFS="#"} $3>1000|| $7=="/bin/bash" {print $1,$3,$7}' passwd

使用if嵌套规范写法：

17、awk -F ':' '{OFS="#"} {if($3>1000|| $7=="/bin/bash") {print $1,$3,$7}}' passwd

NR 表示行

18、awk -F ':' '{print NR":"$0}' passwd == grep -n ':' passwd

打印前10行

19、[root@linux7-128 awk]# awk -F ':' 'NR<=10' passwd

打印前十行并且第一段包含root或者sync的

20、[root@linux7-128 awk]# awk -F ':' 'NR<=10 && $1 ~ /root|sync/' passwd

NF 表示段

21、[root@linux7-128 awk]# awk -F ':' '{print NF":"$0}' passwd

打印段数为6并且第一段包含root或者sync的的

22、[root@linux7-128 awk]# awk -F ':' 'NF==6 && $1 ~ /root|sync/' passwd

赋值，将前三行第一段赋值为root

23、[[email protected]128 awk]# head -n 3 passwd |awk -F ':' '$1="root"'

定义分割符为：

24、[root@linux7-128 awk]# head -n 3 passwd |awk -F ':' '{OFS=":"}

求第三段所有值之和

25、[[email protected]128 awk]# awk -F ':' '{tot=tot+$3}; END {print tot}' passwd 85271

[[email protected]128 awk]# awk -F ':' '{(tot=tot+$3)}; END {print tot}' passwd 85271 括号可以不加

拓展

把一个目录下，过滤所有*.php文档中含有eval的行

grep -r --include="*.php" 'eval' /data/

第九章 正则扩展内容预习加课堂笔记

把两个文件中相同的行合并成一行

相关推荐

第九章正则扩展内容预习加课堂笔记