学习正则的心得

学习正则的心得

作者:邓冠杰
撰写时间:2019年2月07日

首先来简单理解下什么是正则
正则表达式:又称规则表达式,英文名为(Regular Expression),
在代码中常简写为regex、regexpRE
正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本
通俗理解:正则表达式是用于进行文本匹配的工具
好了下面来看一下简单的一个正则表达式
例:hello,my,name,is,hi 在这个字符串中匹配出hi
若要精确的匹配出hi,正则表达式:\bhi\b
注:\b是正则表达式规定的一个特殊代码,我们把它叫做元字符,单词的开头或结尾,
也是单词的分界处,它只匹配一个位置
1、元字符
元字符有很多,而我们先来记几个常用的字符
学习正则的心得
2、转义字符:’\’
如果你想查找元字符本身的话,
比如你查找.,或者*,就出现了问题:你没法指定它们,
因为它们会被解释成其它的意思。这时你就必须使用\来取消这些字符的特殊意义。
因此,你应该使用.和*。当然,要查找\本身,你也得用\
3、常用的限定符
例:如果我要匹配20个数字,那么我是不是就要用到20个\d来匹配吗?
其实不是的,这种遇到有规则性的可以用限定符来简写如:\d{20},那么我们就匹配到了20个数字

下面我们看下常用的限定符(重复)
学习正则的心得
4、先不看答案坐下下面的两个例子
例1:如何匹配下列字符串A-G的大写字符?
字符串:A我喜欢学B的正则DF喜欢学BEF的正则
这时候我们就用到“[]”括号里是:指定的范围
答案:[A-G]
例2:写一个正则表达式匹配几种格式的电话号码
如:(010)16888888,或010-11331144,或01345256565
答案:(?0\d{2}[)-]?\d{8}
5、反义字符
学习正则的心得
6、替换 |
写一个正则表达式匹配几种格式的电话号码
如:(010)16888888,或010-11331144,或01345256565

正则表达式:(0\d{2}[)]\d{8}|0\d{2}[- ]?\d{8}
特别说明:使用替换时,顺序是很重要的
\d{5}-\d{4}|\d{5}这个表达式用于匹配美国的邮政编码。
美国邮编的规则是5位数字,或者用连字号间隔的9位数字
如果你把它改成\d{5}|\d{5}-\d{4}的话,那么就只会匹配5位的邮编(以及9位邮编的前5位)。
原因是匹配替换时,将会从左到右地测试每个分枝条件,如果满足了某个分枝的话,就不会去管其它的替换条件了。Windows98|Windows2000|WindosXP这个例子是为了告诉we替换不仅仅能用于两种规则,也能用于更多种规则
7、分组语法
零宽断言
学习正则的心得
例子:<img “Image(200,200,this)“src=”/Document/Title/Temp/123321.png” >
请匹配出:“Image(200,200,this)”
正则表达式onload.+(?=src)
请匹配出:123321.png
正则表达式:(?<=Document/Title/Temp/).+(?=")
8、贪婪与懒惰
贪婪:当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符这被称为贪婪匹配
懒惰:有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。
如果将前面给出的限定符转化为懒惰匹配模式,只要在它后面加上一个问号?
懒惰限定符
学习正则的心得
看完这些概念和例子再适当的找寻一些匹配的例子再练习一下那么正则不就“手到擒来”了吗
学习正则的心得我用的是猫头鹰头像软件:RegexBuddy 这个可以用来调试匹配正则