正则表达式常用元字符是指在正则表达式中具有特殊含义的字符。它们被用于匹配文本中的不同类型的字符。
以下是常用的元字符整理小结:
-
^:匹配字符串的开始位置,在中括号中表示取反匹配。
-
$:匹配字符串的结束位置。
-
.:匹配任意字符,不包括换行符。
-
*:匹配前一个字符的0个或多个,可以理解为贪婪匹配。
-
+:匹配前一个字符的1个或多个,也是贪婪匹配。
-
?:匹配前一个字符的0个或1个,也称为非贪婪匹配。
-
\d:匹配任意数字字符,等价于 [0-9]。
-
\D:匹配任意非数字字符,等价于 [^0-9]。
-
\w:匹配任意字母、数字或下划线字符,等价于 [A-Za-z0-9_]。
-
\W:匹配任意非字母、数字或下划线字符,等价于 [^A-Za-z0-9_]。
-
\s:匹配任意空白字符,包括空格、制表符、换行符等。
-
\S:匹配任意非空白字符。
-
[]:匹配方括号内的任意字符。
-
|:匹配左右两边任意一个表达式。
-
():标记一个子表达式的开始和结束位置。
以下是两个示例说明:
- 匹配手机号码
我们可以使用以下正则表达式匹配手机号码:^1[3456789]\d{9}$
。其中, ^ 表示匹配字符串的开始位置, 1表示以数字1开头,[3456789] 表示匹配3、4、5、6、7、8、9中的任一个, 数字 \d{9} 表示匹配9个数字字符, $ 表示匹配字符串的结束位置。
- 匹配匹配包含连续两个及以上英文单词的句子
我们可以使用以下正则表达式匹配句子中包含连续两个及以上英文单词:.*\b([a-zA-Z]+)\b.*\b\1\b.*
。其中, . 表示匹配任意字符,直到下面的表达式被匹配到。 \b 表示单词边界,([a-zA-Z]+) 表示匹配至少一个英文字母。 .\b\1\b.* 表示匹配句子中任意位置出现的两个连续的相同的单词。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:正则表达式常用元字符整理小结 - Python技术站