(RPA)手把手——Python正则表达式基本使用(一)

艺赛旗 RPA9.0全新首发免费下载 点击下载

http://www.i-search.com.cn/index.html?from=line1

在 poc 过程中,正则表达式的作用在处理搜集到的信息的时候表现的异常明显。以下内容是关于正则的介绍和基本使用方法:

(RPA)手把手——Python正则表达式基本使用(一)

基本匹配
例如: 一个正则表达式 the, 它表示一个规则: 由字母t开始, 接着是h, 再接着是e.
“the” => The fat cat sat on **the **mat.

  1. 元字符
元字符 描述
. 句号匹配任意单个字符除了换行符.
[ ] 字符种类. 匹配方括号内的任意字符.
[^ ] 否定的字符种类. 匹配除了方括号里的任意字符
* 匹配>=0个重复的在*号之前的字符.
+ 匹配>=1个重复的+号前的字符.
? 标记?之前的字符为可选.
{n,m} 匹配num个大括号之前的字符 (n <= num <= m).
(xyz) 字符集, 匹配与 xyz 完全相等的字符串.
\ 转义字符,用于匹配一些保留的字符 [ ] ( ) { } . * + ? ^ $ \ |
^ 从开始行开始匹配.
$ 从末端开始匹配.
  1. 点运算符

.匹配任意单个字符, 但不匹配换行符. 例如, 表达式.ar匹配一个任意字符后面跟着是a和r的字符串.

“.ar” => the car par ked in the garage.
4 字符集
在方括号中使用连字符来指定字符集的范围. 在方括号中的字符集不关心顺序. 例如, 表达式[Tt]he 匹配 the 和 The.

“[Tt]he” =>** The** car parked in **the **garage.
5 否定字符集
一般来说 ^ 表示一个字符串的开头, 但它用在一个方括号的开头的时候, 它表示这个字符集是否定的. 例如, 表达式[^c]ar 匹配一个后面跟着ar的除了c的任意字符.

“[^c]ar” => The car [par]ked in the [gar])age.