(RPA)手把手——Python正则表达式基本使用(一)
艺赛旗 RPA9.0全新首发免费下载 点击下载
http://www.i-search.com.cn/index.html?from=line1
在 poc 过程中,正则表达式的作用在处理搜集到的信息的时候表现的异常明显。以下内容是关于正则的介绍和基本使用方法:
基本匹配
例如: 一个正则表达式 the, 它表示一个规则: 由字母t开始, 接着是h, 再接着是e.
“the” => The fat cat sat on **the **mat.
- 元字符
元字符 | 描述 |
---|---|
. | 句号匹配任意单个字符除了换行符. |
[ ] | 字符种类. 匹配方括号内的任意字符. |
[^ ] | 否定的字符种类. 匹配除了方括号里的任意字符 |
* | 匹配>=0个重复的在*号之前的字符. |
+ | 匹配>=1个重复的+号前的字符. |
? | 标记?之前的字符为可选. |
{n,m} | 匹配num个大括号之前的字符 (n <= num <= m). |
(xyz) | 字符集, 匹配与 xyz 完全相等的字符串. |
\ | 转义字符,用于匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ |
|
^ | 从开始行开始匹配. |
$ | 从末端开始匹配. |
- 点运算符
.匹配任意单个字符, 但不匹配换行符. 例如, 表达式.ar匹配一个任意字符后面跟着是a和r的字符串.
“.ar” => the car par ked in the garage.
4 字符集
在方括号中使用连字符来指定字符集的范围. 在方括号中的字符集不关心顺序. 例如, 表达式[Tt]he 匹配 the 和 The.
“[Tt]he” =>** The** car parked in **the **garage.
5 否定字符集
一般来说 ^ 表示一个字符串的开头, 但它用在一个方括号的开头的时候, 它表示这个字符集是否定的. 例如, 表达式[^c]ar 匹配一个后面跟着ar的除了c的任意字符.
“[^c]ar” => The car [par]ked in the [gar])age.