shell编程-正则表达式(图文解释)
文章目录
前言
先简单的了解一些正则表达式和通配符的区别:
通配符:* ?[ ] 用来匹配文件名的
正则: 在文件当中匹配正确的字符串
举个栗子说明:
注意: 这种区别仅限于Linux的shell。其他语言可能两者都不区分。
正则式在文件当中匹配字串的,而且是包含匹配。
1. 正则表达式与通配符
正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep、awk、sed等命令可以支持正则表达式。
通配符用来匹配符合条件的文件名,通配符是完全匹配。ls、find、cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配了。
2.基础正则表达式
元字符 | 作用 |
---|---|
* | 前一个字符匹配0次或任意多次 |
. | 配匹除了换行符外任意一个字符 |
^ | 匹配行首。例如:^hello会匹配以hello开头的行。 |
$ | 匹配行尾。例如:hello&会匹配以hello结尾的行。 |
[ ] | 匹配括号中指定的任意一个字符,只匹配一个字符。例如[aeiou]匹配任意一个元音字母,[0-9]匹配任意一位数字,[a-z][0-9]匹配小写字母和以为数字构成的两位字符 |
[^] | 匹配除括号中字符以外的任意一个字符。例如[0-9]匹配一位非数字字符[a-z]表示任意一位非小写字母 |
\ | 转义符。用于取消特殊符号的含义 |
\{n} | 表示其前面的字符恰好出现n次,例如:[0-9]{4}匹配4位数字,[1][3-8][0-9]{9,}匹配手机号码 |
\{n,\} | 表示其前面的字符出现不小于n次,例如:[0-9]{4,\ }表示两位及以上的数字 |
\{n,m\} | 表示其前面的字符至少出现n次,最多出现m次。例如:[a-z]{6,8}匹配6-8位小写字母 |
开始测试:
-
(1) "*"前一个字符匹配0次,或任意多次。创建一个test测试文本,完成下面的测试
命令:grep "a* test"
作用:匹配所有内容,包括空白行
命令:grep "aa*" test
作用:匹配至少包含有一个a的行
命令:grep "aaa*" test
作用:匹配最少包含两个连续a的字符串
命令:grep "aaaaa*" test
作用:匹配最少包含四个连续a的字符串
提示: 这样写没啥意义。
(2) “.”匹配除了换行符外任意一个字符
命令:grep “s..d” test
*作用:“s.d”会匹配在s和d这两个字母之间一定由两个字符的单词
命令:grep "s.*d"
作用:匹配在s和d字母之间有任意字符
命令:grep ".*" test
作用:匹配所有内容 -
(3) “^”匹配行首,“$”匹配行尾
命令:grep "^M" test
作用:匹配以大写“M”开头的行
命令: grep “n$” test
作用:匹配以小写“n”结尾的行
命令:grep -n "^$" test
作用:会匹配空白行
(4) “[ ]” 匹配括号中指定的任意一个字符,只匹配一个字符
命令:grep "s[ao]id" test
作用:匹配s和i字母中,要么是a,要么是b
命令:grep “[0-9]” test
作用:匹配任意一个数字
命令:grep "^[a-z]" test
作用:匹配用小写字母开头的行
(5) "[^]"匹配除中括号的字符以外的任意一个字符
命令:grep "^[^a-z] test"
作用:匹配不用小写字母开头的行
命令:grep "^[a-zA-Z]" test
作用:匹配不用字母开头的行
提示: 这个中括号是不能匹配换行符的,所以空白行列不出来。 -
(6) “\” 转义符
命令:grep "\.$" test
作用: 匹配使用“.”结尾的行
(7) “{n}”表示其前面的字符恰好出现n次
命令:grep "a\{3\}"
作用:匹配a字母连续出现单词的字符串
命令:grep "[0-9]\{3\}" test
作用: 匹配包含连续的三个数字的字符串
(8) "{n,}"表示其前面的字符出现不小于n次
命令:grep “^[0-9]\{3,\}[a-z]” test
作用:匹配最少用连续三个数字开头的行
(9) "{n,m}"匹配其前面的字符至少出现n次,最多出现m次
命令:grep "sa\{1,3}i" test
3.总结
(1) 有基础正则表达式,也有扩展正则表达式。在基础正则里没有()+ ?其实完整正则这些符号都会有的,这些符号在Linux的shell当中,变成了扩展正则
(2) 写的越准,匹配的范围越小。
写的不准,匹配的范围越大。扩展正则表达式用的不多
(3) 要多练习才能熟练掌握
(4) grep是匹配文件内容的行