Python正则表达式是一种用于处理字符串的强大工具,它可以用来匹配、查找、替换和分割字符串,在Python中,我们使用re
模块来处理正则表达式。
(图片来源网络,侵删)
以下是一些常用的正则表达式操作:
1、匹配字符串
import re pattern = r'd+' # 匹配一个或多个数字 text = '123abc456' result = re.findall(pattern, text) print(result) # 输出:['123', '456']
2、替换字符串
import re pattern = r'd+' # 匹配一个或多个数字 text = '123abc456' replacement = 'X' result = re.sub(pattern, replacement, text) print(result) # 输出:'XabcX'
3、分割字符串
import re pattern = r'd+' # 匹配一个或多个数字 text = '123abc456' result = re.split(pattern, text) print(result) # 输出:['', 'abc', '']
4、编译正则表达式
import re pattern = re.compile(r'd+') # 编译一个匹配一个或多个数字的正则表达式 text = '123abc456' result = pattern.findall(text) print(result) # 输出:['123', '456']
以下是一些常用的正则表达式元字符和特殊序列:
元字符 | 描述 | |
. |
匹配任意字符(除了换行符) | |
^ |
匹配字符串的开头 | |
$ |
匹配字符串的结尾 | |
* |
匹配前面的字符0次或多次 | |
+ |
匹配前面的字符1次或多次 | |
? |
匹配前面的字符0次或1次 | |
{m} |
匹配前面的字符m次 | |
{m,n} |
匹配前面的字符m到n次 | |
[] |
定义字符集,匹配其中的任意一个字符 | |
() |
分组 | |
|
或,匹配前面或后面的子表达式 | |
|
转义特殊字符,使其表示字面值 |
以下是一些常用的正则表达式特殊序列:
特殊序列 | 描述 |
A |
匹配字符串的开头 |
Z |
匹配字符串的结尾或换行符之前的空字符串 |
b |
匹配单词边界 |
B |
匹配非单词边界 |
d |
匹配数字,等价于[09] |
D |
匹配非数字,等价于[^09] |
s |
匹配空白字符,等价于[ tnrfv] |
S |
匹配非空白字符,等价于[^ tnrfv] |
w |
匹配字母、数字或下划线,等价于[azAZ09_] |
W |
匹配非字母、数字或下划线,等价于[^azAZ09_] |
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)