Python之re模块详解
什么是re模块
re
模块是Python的内置模块,提供了正则表达式相关操作功能。正则表达式是一种表达文本模式的方法,通过一些特殊字符和普通字符的组合,能够有效地匹配和识别文本中的模式。
re模块函数
re.findall
re.findall(pattern, string, flags=0)
:
在字符串 string
中查找符合正则表达式 pattern
的所有子串,并以列表的形式返回。
其中, pattern
是正则表达式,flags
是可选参数,表示正则表达式的匹配方式。
示例1:
import re
text = "apple,banana,pear,grape,orange"
result = re.findall("[abgp]+", text)
print(result) # ['apple', 'banana', 'grape']
上述代码中,正则表达式 [abgp]+
用于匹配所有包含 a
b
g
p
这四个字母中一个或多个的单词。这里匹配到的单词有 apple
banana
grape
三个,分别被以列表形式返回。
re.search
re.search(pattern, string, flags=0)
:
在字符串 string
中查找符合正则表达式 pattern
的第一个子串,并以MatchObject
对象的形式返回。
其中, pattern
是正则表达式,flags
是可选参数,表示正则表达式的匹配方式。
示例2:
import re
text = "apple,banana,pear,grape,orange"
match_obj = re.search("b.*n", text)
if match_obj:
print(match_obj.group()) # banana
上述代码中,正则表达式 b.*n
用于匹配包含 b
开头,n
结尾的单词。这里匹配到的单词是 banana
,通过.group()
方法得到 MatchObject
的字符串匹配结果为 banana
。
总结
本文通过简单介绍了re
模块的概念,并提供了两个常用函数的示例说明。对于Python初学者,掌握正则表达式的使用,将会对日后爬虫、文本分析、数据处理等领域有很大帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python之re模块详解 - Python技术站