正则表达式的基本用法
正则表达式
1.正则表达式的概念
regular expression regex RE
正则表达式是用来简介表达一组字符串的表达式,通用的字符串表达框架,判断某字符串的特征归属。
2.正则表达式的作用
表达文本类型的特征(病毒、入侵等);
同时查找或替换一组字符串;
匹配字符串全部或部分区域。
3.正则表达式的使用
编译:将符合正则表达式语法的字符串转换成正则表达式特征
4.正则表达式的语法
正则表达式语法由字符和操作符构成。
5.实例:
正则表达式 对应字符串
P(Y|YT|YTH|YTHO)?N PN PYN OYTN PYTHN PYTHON
PYTHON+ PYTHON PTHONN PYTHONNNN
PY[TH]ON PYTHN PYHON
PY[^TH]?ON PYON PYaON PYbON PYcON
PY{:3]N PN PYN PYYN PYYN PYYYN
经典正则表达式实例
^[A-Za-z]+$ 由26个字母组成的字符串
^[A-Za-z0-9]+$ 由26个字母和数字组成的字符串
^-?\d+$ 整数形式的字符串
^[0-9]*[1-9][0-9]*$ 正整数形式的字符串
[1-9]\d{5} 中国境内邮政编码,6位
[\u4e00-\u9fa5] 匹配中文字符
\d{3}-\d{8}|\d{4}-\d{7} 国内电话号码
匹配IP地址的正则表达式
IP地址字符串形式的正则表达式(IP地址分4段,每段0-255)
\d+.\d+.\d+.\d+
或\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}
或精确学法
0-99:[1-9]?\d 100-199:1\d{2}
200-249:2[0-4]\d 250-255:25[0-5]