python基础学习14----正则表达式
2021-06-30 02:06
标签:mat class 内容 组合 模式匹配 基础 arc 函数 通过 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 在python中正则表达式被封装到了re模块,通过引入re模块来使用正则表达式 re模块中有很多正则表达式处理函数,首先用findall函数介绍基本基本字符的含义 元字符有:. \ * + ? ^ $ | {} [] () findall函数 遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表 . 匹配任意除换行符"\n"外的字符 * 匹配前一个字符0或多次 + 匹配前一个字符1次或无限次 ? 匹配前一个字符0次或1次 ^ 匹配字符串开头。在多行模式中匹配每一行的开头 $ 匹配字符串末尾,在多行模式中匹配每一行的末尾 | 或。匹配|左右表达式任意一个,从左到右匹配,如果|没有包括在()中,则它的范围是整个正则表达式 {} {m}匹配前一个字符m次,{m,n}匹配前一个字符m至n次,若省略n,则匹配m至无限次 [] 字符集。对应的位置可以是字符集中任意字符。字符集中的字符可以逐个列出,也可以给出范围,如[abc]或[a-c]。[^abc]表示取反,即非abc,所有特殊字符在字符集中都失去其原有的特殊含义。用\反斜杠转义恢复特殊字符的特殊含义。 () 被括起来的表达式将作为分组,从表达式左边开始每遇到一个分组的左括号“(”,编号+1.分组表达式作为一个整体,可以后接数量词。表达式中的|仅在该组中有效。 要想看到被完全匹配的内容,我们可以使用一个新的函数search函数 search函数 在字符串内查找模式匹配,只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None \ 转义字符,使后一个字符改变原来的意思 未完 python基础学习14----正则表达式 标签:mat class 内容 组合 模式匹配 基础 arc 函数 通过 原文地址:https://www.cnblogs.com/sfencs-hcy/p/9643713.htmlimport re
temp=re.findall("a.c","abcdefagch")
print(temp)#[‘abc‘, ‘agc‘]
temp=re.findall("a*b","abcaaaaabcdefb")
print(temp)#[‘ab‘, ‘aaaaab‘, ‘b‘]
temp=re.findall("a+b","abcaaaaabcdefb")
print(temp)#[‘ab‘, ‘aaaaab‘]
temp=re.findall("a?b","abcaaaaabcdefb")
print(temp)#[‘ab‘, ‘ab‘, ‘b‘]
temp=re.findall("^ab","abcaaaaabcdefb")
print(temp)#[‘ab‘]
temp=re.findall("ab$","abcaaaaabcdefab")
print(temp)#[‘ab‘]
temp=re.findall("abc|def","abcdef")
print(temp)#[‘abc‘, ‘def‘]
temp=re.findall("a{3}","aabaaacaaaad")
print(temp)#[‘aaa‘, ‘aaa‘]
temp=re.findall("a{3,5}","aaabaaaabaaaaabaaaaaa")
print(temp)#[‘aaa‘, ‘aaaa‘, ‘aaaaa‘, ‘aaaaa‘]在获取了3个a后,若下一个还是a,并不会得到aaa,而是算下一个a
temp=re.findall("a[bcd]e","abcdefagch")
print(temp)#[]此时bcd为b或c或d
temp=re.findall("a[a-z]c","abcdefagch")
print(temp)#[‘abc‘, ‘agc‘]
temp=re.findall("[^a]","aaaaabcdefagch")
print(temp)#[‘b‘, ‘c‘, ‘d‘, ‘e‘, ‘f‘, ‘g‘, ‘c‘, ‘h‘]
temp=re.findall("[^ab]","aaaaabcdefagch")
print(temp)#[‘c‘, ‘d‘, ‘e‘, ‘f‘, ‘g‘, ‘c‘, ‘h‘]a和b都不会被匹配
temp=re.findall("(abc){2}a(123|456)c","abcabca456c")
print(temp)#[(‘abc‘, ‘456‘)]
temp=re.findall("(abc){2}a(123|456)c","abcabca456cbbabcabca456c")
print(temp)#[(‘abc‘, ‘456‘), (‘abc‘, ‘456‘)]
#这里有()的情况中,findall会将该规则的每个()中匹配到的字符创放到一个元组中
temp=re.search("(abc){2}a(123|456)c","abcabca456c")
print(temp)#