python正则表达式
正则表达式(RE)是一种小型的高度专业化的语言,它在各种语言里都有接口。在python中, 通过re模块实现。本文分成三个部分介绍python正则表达式。一:正则表达式的语法;二:python里怎么实现正则表达式;三:正则的实际运用
1
2
python的正则语言主要是在re模块实现,下面简单的介绍re模块的语法:
3
在目前的工作中,主要是在两个地方用到正则,一个是爬虫;另一个是分拣。
如果你想学习Python可以来这个群,首先是四七二,中间是三零九,最后是二六一,里面有大量的学习资料可以下载。
- 爬虫:
如果要截取面包屑:图中标红的地方
在python里调用re模块,输入以下代码:
输出:print crumb
酒类>中外名酒>白酒>五粮液(WULIANGYE)>五粮液股份公司兴隆富贵天下-祝君兴旺发达52°1…
2. 分拣参数:
商品标题:Samsung/三星 MB-MC128D TF(microSD)卡 128GB UHS-1 读取速度80MB/S写入速度20MB/S
目的:分拣出手机型号
代码:
结果:其实就是识别数字+字母的组合,并且过滤掉全数字的和全字母的,长度大于1的字符串。结果输出有5个,可以再加一些过滤的规则,过滤掉不要的字符串。
MB-MC128D
128GB
UHS-1
80MB
20MB