最近打比赛用到了正则表达式,于是就总结了一些。
常用的有三种
1.re.match 从开头匹配
2.re.search 搜索整个字符串f返回第一个子串
3.re.findall 搜索整个字符串中所有满足的字符串,返回列表
首先看一下re.findall
re.findall('\d_\d+\.jpg', '3_58.jpg')# ['3_58.jpg']re.findall('\d_\d+\.jpg', '358.jpg')# []re.findall('\d_\d+\.jpg', '13_58.jpg2')['3_58.jpg']re.findall('^\d_\d+\.jpg$', '13_58.jpg2') # ^开头 $ 结尾# []
.*
贪婪模式 (匹配尽可能多的)
.*?
非贪婪模式 (匹配尽可能少的字符)
n = re.match('123.*123', '123456123789123')# 123456123789123n = re.match('123.*?123', '123456123789123')# 123456123
group
group() 同group(0)就是匹配正则表达式整体结果group(1) 列出第一个括号匹配部分,group(2) 列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。
n = re.match('(.*)(有机质.*?%)(.*)', '总养分≥31%(16-5-10),有机质≥15% ,含氯(中氯)').group(2)# '有机质≥15%'n = re.match('(.*)(有机质.*?%)(.*)', '总养分≥31%(16-5-10),有机质≥15% ,含氯(中氯)').group(1)# '总养分≥31%(16-5-10),'n = re.match('(.*)(有机质.*?%)(.*)', '总养分≥31%(16-5-10),有机质≥15% ,含氯(中氯)').group(3)# ' ,含氯(中氯)'
正则表达式中的三组括号把匹配结果分成三组