Python正则表达式急速入门(小结)

yizhihongxing

Python正则表达式急速入门

正则表达式是一种用于描述字符串模式的语言,可以用于配、查找、替换和分割。在Python中,可以使用re模块使用正则表达式。本攻略将详细介绍正则表达式语法、字符集、转义字符以及常用函数,并提供两个示例说明。

正则表达式语法

正则表达式由普通字符和元字符组成,普通字符表示本身,而元字符有特殊的含义。下面是一些常用的元字符:

  • .:匹配任意字符。
  • ^:匹配字符串的开头。
  • $:匹配字符串的结尾。
  • *:匹配前面字符零次或多次。
  • +:匹配前面的字符一次或多次。
  • ?:匹配前面的字符零次或一次。
  • {n}:匹配前面字符n次。
  • {n,}:匹配前面的字符至少n次。
  • {n,m}:匹配前面的字符至少n次,但不超过m次。

下面是一个示例:

import re

# 定义正则表达式
pattern = r'ab*c'

# 定义字符串
string1 = ''
string2 = 'abc'
string3 = 'bc'
string4 = 'abbbc'

# 使用re.match方法匹配字符串
match1 = re.match(pattern, string1)
match2 = re.match(pattern, string2)
match3 = re.match(pattern, string3)
match4 = re.match(pattern, string4)

# 输出匹配结果
print(match1)  # None
print(match2.group())  # abc
print(match3)  # None
print(match4.group())  # abbbc

在这个示例中,我们使用正则表达式ab*c匹配字符串中的字符。然后我们定义了四个字符串'''abc''bc''abbbc',其中包含不同数量的字符b。最后我们使用re.match()方法匹配,并输出匹配结果。

字符集

字符集用于匹配一组字符中的任意一个字符。下面是一些常用的字符集:

  • [abc]:匹配字符abc
  • [^abc]:匹配除了字符abc之外的任意字符。
  • [a-z]:匹配任意小写字母。
  • [A-Z]:匹配任意大写字母。
  • [0-9]:匹配任意数字。
  • [a-zA-Z0-9]:匹配任意字母和数字。

下面是一个示例:

import re

# 定义正则表达式
pattern = r'[a-z]+'

# 定义字符串
string = 'Hello World!'

# 使用re.findall()方法查找匹配项
matches = re.findall(pattern, string)

# 输出匹配结果
print(matches)  # ['ello', 'orld']

在这个示例中,我们使用正则表达式[a-z]+匹配字符串中的小写字母。然后定义了一个字符串Hello World!,其中包含大写字母和标点符号。然后,我们使用re.findall()方法查找所有匹配项,并输出匹配结果['ello', 'orld']

转义字符

转义字符用于匹配一些特殊的字符,例如\.*等。下面是一些常用的转义字符:

  • .:匹配.字符。
  • \\:匹配\字符。
  • *:匹配*字符。
  • +:匹配+字符。
  • ?:匹配?字符。
  • \{:匹配{字符。
  • \}:匹配}字符。
  • \(:匹配(字符。
  • \):匹配)字符。
  • \|:匹配|字符。

下面是一个示例:

import re

# 定义正则表达式
pattern = r'\d.\d+'

# 定义字符串
string = 'The price is $3.99.'

# 使用re.search()方法查找匹配项
match = re.search(pattern, string)

# 输出匹配结果
if match:
    print(match.group())  # 3.99
else:
    print('No match')

在这个示例中,我们使用正则表达式\d.\d+匹配字符串中的价格。然后定义了一个字符串The price is $3.99.,其中包含了价格信息。最后,我们使用re.search()方法查找匹配项,并输出匹配结果3.99

常用函数

在Python中,re模块提供了多个函数用于正则表达式的配、查找、替换和分割字符串。下面是一些常用的:

  • re.match(pattern, string, flags=0):从字符串的开头匹配正则表达式,如果匹配成功返回一个匹配对象,否则返回None。
  • re.search(pattern, string, flags=0):在字符串中查找第一个匹配正则表达式的位置,如果匹配成功返回一个匹配对象,否则返回None。
  • re.findall(pattern, string, flags=0):查找字符串中所有匹配正则表达式的子串,并返回一个列表。
  • re.sub(pattern, repl, string, count=0, flags=0):使用repl替换字符串中所有匹配正则表达式的子串,count表示替换的最大次数。
  • re.split(pattern, string, maxsplit=0, flags=0):使用正则表达式分割字符串,maxsplit表示分割的最大次数。

下面是一个示例:

import re

# 定义正则表达式
pattern = r'\d+'

# 定义字符串
string = 'I have 2 cats and 3 dogs.'

# 使用re.findall()方法查找匹配项
matches = re.findall(pattern, string)

# 输出匹配结果
print(matches)  # ['2', '3']

# 使用re.sub()方法替换匹配项
new_string = re.sub(pattern, '0', string)

# 输出替换结果
print(new_string)  # 'I have 0 cats and 0 dogs.'

# 使用re.split()方法分割字符串
split_string = re.split(pattern, string)

# 输出分割结果
print(split_string)  # ['I have ', ' cats and ', ' dogs.']

在这个示例中,我们使用正则表达式\d+匹配字符串中的数字。然后定义了一个字符串I have 2 cats and 3 dogs.,其中包含了数字信息。然后,我们使用re.findall()方法查找所有匹配项,并输出匹配结果['2', '3']。然后使用re.sub()方法将所有数字替换为0,并输出替换结果'I have 0 cats and 0 dogs.'。最后,我们使用re.split()方法将字符串分割为多个子串,并输出分割结果['I have ', ' cats and ', ' dogs.']

示例说明

示例1

import re

# 定义正则表达式
pattern = r'\d{3}-\d{2}-\d{4}'

# 定义字符串
string = 'My social security number is 123-45-6789.'

# 使用re.search()方法查找匹配项
match = re.search(pattern, string)

# 输出匹配结果
if match:
    print(match.group())
else:
    print('No match')

在这个示例中,我们使用正则表达式\d{3}-\d{2}-\d{4}匹配字符串中的社会安全号码。然后我们定义一个字符串My social security number is 123-45-6789.,其中包含了社会安全号码信息。最后,我们使用re.search()方法查找匹配项,并输出匹配结果123-45-6789

示例2

import re

# 定义正则表达式
pattern = r'\b[A-Z][a-z]+\b'

# 定义字符串
string = 'I have a cat named Whiskers and a dog named Rover.'

# 使用re.findall()方法查找匹配项
matches = re.findall(pattern, string)

# 输出匹配结果
print(matches)  # ['I', 'Whiskers', 'Rover']

在这个示例中,我们使用正则表达式\b[A-Z][a-z]+\b匹配字符串中的单词。然后我们定义了一个字符串I have a cat named Whiskers and a dog named Rover.,其中包含了多个单词。最后,我们使用re.findall()方法查找所有匹配项,并输出匹配结果['I', 'Whiskers', 'Rover']

结语

本攻略详细介绍了Python中正则表达式的语法、字符集、转义字符以及常用函数,并提供了两个示例说明。正则表达式是一种强大的字符串处理工具,可以用于各种文本处理场景。掌握正则表达式的语法和函数,可以大大提高文本处理的效率和准确性。如果你处理大量的文本数据,可以使用Python正则表达式来处理。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python正则表达式急速入门(小结) - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Python实现正整数分解质因数操作示例

    Python实现正整数分解质因数的操作示例 在数学中,正整数可以分解成若干个质数的积的形式,称为正整数的质因数分解。本文将使用 Python 语言实现正整数分解质因数的操作。实现过程分为两部分:一、编写判断质数函数;二、质因数分解。 判断质数函数 质数的定义是只有 1 和本身两个因数的自然数,因此判断一个数是不是质数,只需要循环判断从 2 开始到自己的平方根…

    python 2023年6月5日
    00
  • python读写修改Excel之xlrd&xlwt&xlutils

    我来为你讲解一下“python读写修改Excel之xlrd&xlwt&xlutils”的完整实例教程。 什么是xlrd、xlwt、xlutils xlrd、xlwt、xlutils是python处理Excel(xls)文件的常用库。其中,xlrd负责读取Excel数据,xlwt负责写入Excel数据,xlutils则是对已有Excel进行修改…

    python 2023年5月13日
    00
  • 如何利用Python实现自动打卡签到的实践

    利用Python实现自动打卡签到共有以下几个步骤: 第一步:确定打卡网站及具体签到规则 首先需要确定打卡网站和相应的签到规则,比如需要填写的信息、签到方式、签到时间等。 第二步:模拟登录打卡网站 利用requests库和beautifulsoup4库模拟登录打卡网站,从网站获取到自己的账户登录信息和Cookie信息。 具体实现示例: import reque…

    python 2023年5月19日
    00
  • python os.fork() 循环输出方法

    在介绍python os.fork() 循环输出方法之前,我们需要先了解几个概念。 fork():创建一个新进程,该进程是原始进程的复制,并从fork()返回两次,一次是在原始进程中,返回子进程的pid, 另一次是在子进程中,返回0。 os模块:Python的标准库之一,提供了与操作系统交互的接口。 循环输出:指在代码中使用循环语句反复输出指定内容。 下面是…

    python 2023年6月2日
    00
  • 单利模式及python实现方式详解

    单例模式是一种创建型设计模式,它保证一个类只有一个实例,并提供一个全局访问点来访问该实例。在 Python 中,实现单例模式的方式有很多种,下面我们来详细讲解单例模式及其 Python 实现方式。 什么是单例模式 单例模式是一种保证一个类只有一个实例对象的设计模式。通常情况下,我们使用类的构造函数创建一个新的对象,但是单例模式只允许创建一个实例,并提供一个全…

    python 2023年6月6日
    00
  • 详解Python如何利用turtle绘制中国结

    下面是详解Python如何利用turtle绘制中国结的攻略: 一、前言 turtle模块是Python的一个绘图库,其能够将基本图形如直线、圆、等角三角形等拼接成复杂图形。本文将详细介绍如何利用turtle模块绘制中国结。 二、准备工作 在编写代码前,需要导入turtle模块: import turtle 然后,开启画布 window = turtle.Sc…

    python 2023年6月3日
    00
  • python3中函数参数的四种简单用法

    下面是关于“Python3中函数参数的四种简单用法”的详细讲解。 一、函数参数的概念 在Python中,函数是一个可以执行特定任务的代码块,它可以接收输入值,经过处理,并输出结果。而函数参数就是传递给函数的输入值。根据Python3的函数参数类型,可以分为如下四种: 位置参数 默认参数 可变参数 关键字参数 接下来,我们将详细介绍这四种类型的函数参数。 二、…

    python 2023年6月5日
    00
  • Python数据存储之XML文档和字典的互转

    在Python中,可以使用标准库中的xml.etree.ElementTree模块来处理XML文档。同时,Python中也支持字典类型的数据存储和操作,而字典又是一种类似于JSON的数据格式,非常常用。那么如何在二者之间进行转换呢?下面就是XML文档和字典相互转换的攻略。 XML转字典 使用Python的xml.etree.ElementTree模块,可以将…

    python 2023年5月13日
    00
合作推广
合作推广
分享本页
返回顶部