python爬虫中常用的正则表达式

之所以叫正则表达式,是因为它们可以识别正则字符串(regular string)而什么又是正则字符串呢?其实就是任意可以用一系列线性规则构成的字符串,就像:
(1) 字母“a”至少出现一次;
(2) 后面跟着字母“b”重复 5 次;
(3) 后面再跟字母“c”重复任意偶数次;
(4) 最后一位是字母“d”,也可以没有。
在python爬虫中会经常用到正则表达式,所以掌握一些常用的正则表达式十分重要。下面这个表格列举了python爬虫中常用的一些正则表达式符号。(表格来源于书《python网络数据采集》)
python爬虫中常用的正则表达式