shell编程-正则表达式(图文解释)

前言

先简单的了解一些正则表达式和通配符的区别:
通配符:* ?[ ] 用来匹配文件名的
正则: 在文件当中匹配正确的字符串

举个栗子说明:
shell编程-正则表达式(图文解释)
shell编程-正则表达式(图文解释)
shell编程-正则表达式(图文解释)
注意: 这种区别仅限于Linux的shell。其他语言可能两者都不区分。
正则式在文件当中匹配字串的,而且是包含匹配。

1. 正则表达式与通配符

正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。
通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。

2.基础正则表达式

元字符 作用
* 前一个字符匹配0次或任意多次
. 配匹除了换行符外任意一个字符
^ 匹配行首。例如:^hello会匹配以hello开头的行。
$ 匹配行尾。例如:hello&会匹配以hello结尾的行。
[ ] 匹配括号中指定的任意一个字符,只匹配一个字符。例如[aeiou]匹配任意一个元音字母,[0-9]匹配任意一位数字,[a-z][0-9]匹配小写字母和以为数字构成的两位字符
[^] 匹配除括号中字符以外的任意一个字符。例如[0-9]匹配一位非数字字符[a-z]表示任意一位非小写字母
\ 转义符。用于取消特殊符号的含义
\{n} 表示其前面的字符恰好出现n次,例如:[0-9]{4}匹配4位数字,[1][3-8][0-9]{9,}匹配手机号码
\{n,\} 表示其前面的字符出现不小于n次,例如:[0-9]{4,\ }表示两位及以上的数字
\{n,m\} 表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]{6,8}匹配6-8位小写字母

开始测试:

  • (1) "*"前一个字符匹配0次,或任意多次。创建一个test测试文本,完成下面的测试
    命令: grep "a* test"
    作用:匹配所有内容,包括空白行
    命令: grep "aa*" test
    作用:匹配至少包含有一个a的行
    命令: grep "aaa*" test
    作用:匹配最少包含两个连续a的字符串
    命令: grep "aaaaa*" test
    作用:匹配最少包含四个连续a的字符串
    shell编程-正则表达式(图文解释)
    shell编程-正则表达式(图文解释)
    提示: 这样写没啥意义。
    shell编程-正则表达式(图文解释)
    shell编程-正则表达式(图文解释)
    shell编程-正则表达式(图文解释)
    (2) “.”匹配除了换行符外任意一个字符
    命令: grep “s..d” test
    *作用:“s.d”会匹配在s和d这两个字母之间一定由两个字符的单词
    命令: grep "s.*d"
    作用:匹配在s和d字母之间有任意字符
    命令: grep ".*" test
    作用:匹配所有内容
    shell编程-正则表达式(图文解释)

  • (3) “^”匹配行首,“$”匹配行尾
    命令: grep "^M" test
    作用:匹配以大写“M”开头的行
    命令: grep “n$” test
    作用:匹配以小写“n”结尾的行
    命令: grep -n "^$" test
    作用:会匹配空白行
    shell编程-正则表达式(图文解释)
    (4) “[ ]” 匹配括号中指定的任意一个字符,只匹配一个字符
    命令: grep "s[ao]id" test
    作用:匹配s和i字母中,要么是a,要么是b
    命令: grep “[0-9]” test
    作用:匹配任意一个数字
    命令: grep "^[a-z]" test
    作用:匹配用小写字母开头的行
    shell编程-正则表达式(图文解释)
    (5) "[^]"匹配除中括号的字符以外的任意一个字符
    命令: grep "^[^a-z] test"
    作用:匹配不用小写字母开头的行
    命令: grep "^[a-zA-Z]" test
    作用:匹配不用字母开头的行
    shell编程-正则表达式(图文解释)
    提示: 这个中括号是不能匹配换行符的,所以空白行列不出来。
    shell编程-正则表达式(图文解释)

  • (6) “\” 转义符
    命令: grep "\.$" test
    作用: 匹配使用“.”结尾的行
    shell编程-正则表达式(图文解释)
    (7) “{n}”表示其前面的字符恰好出现n次
    命令: grep "a\{3\}"
    作用:匹配a字母连续出现单词的字符串
    命令: grep "[0-9]\{3\}" test
    作用: 匹配包含连续的三个数字的字符串shell编程-正则表达式(图文解释)
    shell编程-正则表达式(图文解释)
    (8) "{n,}"表示其前面的字符出现不小于n次
    命令: grep “^[0-9]\{3,\}[a-z]” test
    作用:匹配最少用连续三个数字开头的行
    shell编程-正则表达式(图文解释)
    (9) "{n,m}"匹配其前面的字符至少出现n次,最多出现m次
    命令: grep "sa\{1,3}i" test
    shell编程-正则表达式(图文解释)
    shell编程-正则表达式(图文解释)

3.总结

(1) 有基础正则表达式,也有扩展正则表达式。在基础正则里没有()+ ?其实完整正则这些符号都会有的,这些符号在Linux的shell当中,变成了扩展正则
(2) 写的越准,匹配的范围越小。
         写的不准,匹配的范围越大。扩展正则表达式用的不多
(3) 要多练习才能熟练掌握
(4) grep是匹配文件内容的行