正则表达式和grep

正则表达式分为两类:基本正则表达式和扩展正则表达式。


基本正则表达式元字符:

   字符匹配:

    .:匹配任意一个字符。

    []:匹配[]中指定范围内的任意一个字符。

    [^]:指定范围外的任意一个字符;也可以得知,在[]括号内,^表示取反。


   次数匹配:

    *:其前面字符出现任意次。

    \?:其前字符出现0或1次;

    \{m,n}:其前字符出现最少m次,最多出现n次。如果没有上限,n可不写,若至少出现0次,m为0.既m不可省略。

    .*:其前出现任意长度的任意字符。

    

    字符牟定:

    ^:行首牟定。

    &:行尾牟定。

    \< 或 \b:牟定单词在行首

    \> 或 \b:牟定单词在行尾

    \(\):用于分组。后向引用:\1,\2,\3 ...表示引用第n对小括号内的内容

grep:则支持使用基本正则表达式定义的模式来过滤文本的命令。

    -i:忽略匹配字母的大小写;

    -v:反向匹配,显示为匹配的内容

    -o:只显示匹配到的内容

    --color:颜色显示

   -E=eprep:使用扩展正则进行匹配。

    -A 数字、-B 数字、-C 数字:-A(after)表示不止显示匹配行,同时显示匹配到的后面N行。-B(before)表示同时显示匹配前N行,-C表示同时显示前N行和后N行

    更多选项用man 进行查看。

说明一下,基本正则表达式工作在贪婪模式下。



扩展正则表达式

   字符匹配,位置牟定:与基本正则相同

        . 

        []

        [^]

    次数匹配:

        *:与基本正则相同,其前面字符出现任意次。

        ?:与基本正则相同,其前字符出现0或1次;

        +:多了一个 + 表示匹配其前字符至少一次。相当于\{1,\} ?+=*

        {m,n}:扩展正则中不需要使用\进行转意

      分组与

        ():分组

        \1,\2,\3 ... 后向引用

    或者

      | :|前后各为一个整体。例如 abc|dec:表示abc 或者 dec.可使用 egrep --color 进行验证。若要表示c 或者d 可是要(),ab(c|d)ec