python3 正则表达式基础廖雪峰

Python3正则表达式基础

正则表达式是一种用于描述字符串模式的语言,可以用于配、查找、替换和分割。在Python中,可以使用re模块来使用正则表达式。本文将详细介绍Python中正则表达式的语法、字符集、转义字符以及常用函数,并提供两个示例说明。

基本语法

正则表达式由普通字符和元成,普字符表示本身,而元字符则有特殊的含义。下面是一些常用元字符:

  • .:匹配任意字符。
  • ^:匹配字符串的开头。
  • $:匹配字符串的结尾。
  • *:匹配前面的字符零次或多次。
  • +:配前面的字符一次多次。
  • ?:匹配前面的字符零次或一次。
  • {n}:匹配前面字符n次。
  • `{n,:匹前面的字符至少n次。
  • {n,m}:匹配前面的字符至少n次,但不超过m次。

下面是一个示例:

import re

# 定义正则表达式
pattern = r'ab*c'

# 定义字符串
string1 = ''
string2 = 'abc'
string3 = 'bcstring4 = 'abbbc'

# 使用re.match()方法匹配字符串
match1 = re.match(pattern, string1)
match2 = re.match(pattern, string2)
match3 = re.match(pattern, string3)
match4 = re.match(pattern, string4)

# 输出匹配结果
print(match1)  # None
print(match2.group())  # abc
print(match3.group())  # abbc
print(match4.group())  # abbbc

在这个示例中,我们使用正则表达式ab*c匹配字符串中的字符。然后我们定义了四个字符串acabcabbcabbbc,其中包含不同数量的字符b。最后我们使用re.match()方法匹配,并输出匹配结果。

字符集

字符集用于匹配一组字符中的任意一个字符。下面是一些常用的字符集:

  • [abc]:匹配字符a、b或c。
  • [^abc]:匹配除了字符a、b和c之外的任意字符。
  • [a-z]:匹配任意小写字母。
  • [A-Z]:匹配任意大写字母。
  • [0-9]:匹配任意数字。
  • [a-zA-Z0-9]:匹配任母和数字

下面一个示例:

import re

# 定义正则表达式
pattern = r'[a-z]+'

# 定义字符串
string = 'Hello World!'

# 使用re.findall()方法查找匹配matches = re.findall(pattern, string)

# 输出匹配结果
print(matches)  # ['ello', 'orld']

在这个示例中,我们使用正则表达式[a-z]+匹配字符串中的写字母。然后定义了一个World!,其中包含大写字母标点符号。后,我们使用re.findall()方法查找所有匹配项,并输出匹配结果['ello', 'orld']

转义字符

转义字符用于匹配一些特殊的字符,例如\.*等。下面是一些常用的转字符:

-.:匹配.字符。
-
\:匹配字符。
- \*:匹配*字符。
- \+:匹配`字符。
-
\?:匹配?字符。
-
{:匹配{字符。
-
}:匹配}字符。
-
(:匹配(字符。
-
):匹配)字符。
-
|:匹配|`字符。

下面一个示例:

import re

#义正则表达
pattern = r'\d.\d+'

# 定义字符串
string = 'The price is $3.99.'

# 使用re.search()方法查找匹配项
match = re.search(pattern, string)

# 输出匹配结果
if match:
    print(match.group())  # 3.99
else:
    print('No match```

在这个示例中,我们使用正则表达式`\d.\d+`匹配字符串中的价格。然后定义了一个`The price is $3.99.`,其中包含了价格信息。最后,我们使用re.search()方法查找配,并输出匹配结果`3.99`。

## 常用函数

在Python中,re块提供了多个函数用于正则表达式的配、查找、替换和分割字符串。下面一些常用的函数:

- `.match(pattern, string, flags=0)`:从字符串的开头匹配正则表达式,如果匹配成功返回一个匹配对象,否则返回None。
- `re.search(pattern, string, flags=0)`:在字符串中查找第一个匹配正则表达式的位置,如果匹配成功返回一个匹配对象,否则返回None。
- `re.findall(pattern, string, flags=0)`:查找字符串中所有匹配正则表达式的串,并返回一个列表。
- `re.sub(pattern, repl, string, count=0, flags=0)`:使用repl替换字符串中所有匹配正则表达式的子串,count表示替换的最大次数。
- `re.split(pattern, string, maxsplit0, flags=0)`:使用正则表达式分割字符串,maxsplit表示分割的最大次数。

下面是一个示例:

```python
import re

# 定义正则表达式
pattern = r'\d+'

# 定义字符串
string = 'I have 2 cats and 3 dogs.'

# 使用re.findall()方法找匹配
matches = re.findall(pattern, string)

# 输出匹配结果
(matches)  # ['2', '3']

# 使用re.sub()方法替换匹配项
new_string = re.sub(pattern, '0', string)

# 输出替换结果
print(new_string) # 'I have 0 cats and 0 dogs.'

# 使用re.split()方法分割字符串
split_string = re.split(pattern, string)

# 输出分割结果
print(split_string)  # ['I have ', ' cats and ' dogs.']

在这个示例中,我们使用正则表达式\d+匹配字符串中的数字。然后定义了一个字符串I have 2 cats and 3 dogs.,其中包含数字信息。后,我们使用re.findall()方法查找所有匹配项,并输出匹配结果['2', '3']。然后使用re.sub()方法将所有数字替换为0,并替换结果'I 0 cats and 0 dogs.'。最后,我们使用re.split()方法将字符串分割多个子串,并输出分结果['I have ', ' cats and ' dogs.']

示例说明

1

import re

# 定义正则表达式
pattern = r'\d{3}-\d{2}-\d{4}'

# 定义字符串
string = 'My social security number is 123-45-6789.'

# 使用re.search()方法查找匹配
match = re.search(pattern, string)

# 输出匹配结果
if match:
    print(match.group())
else:
    print('No match')

在这个示例中,我们使用正则表达式\d{3}-d2}-\d{4}匹配字符串中的社会安全号码。然后我们定义了一个字符串My social security number is 123-45-6789.,其中包含了社会安全号码最后,我们使用re.search()方法查找匹配项,并输出匹配结果123-45-6789

示例2

import re

# 定义正则表达式
pattern = r'\b[A-Z][a-z]+\'

# 定义字符串
string = 'I have a cat named Whiskers and a dog named Rover.'

# 使用re.findall()方法查找匹配
matches = re.findall(pattern, string)

# 输出匹结果
print(matches)  # ['I', 'Whiskers', 'Rover']

在这个示例中,我们使用正则表达式\b[A-Z][a-z]+\b匹配字符串中的单词。然后我们了一个字符串I have a cat named Whiskers and a dog named.,其中包含了多个单词。最后,我们使用re.findall()方法查找所有匹配项,并输出匹配结果['I', 'Whiskers', 'Rover']

结论

本文详细介绍了中则表式的语、字符集、转义字符以及常用函数。正则表式是一种强大的字符串处理工具,可以用于各种文。练掌则表达式的语法和函数,可以大大提高文本处理的效率和准确性。如果你需要处理大量的文本数据可以使用Python正则表达式实现。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python3 正则表达式基础廖雪峰 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Python将Excel表格按某列拆分为多个sheet实现过程

    针对“Python将Excel表格按某列拆分为多个sheet”这个需求,一般可以采用以下步骤进行处理: 1.使用Python的pandas库读取Excel表格数据,可以使用read_excel函数。2.根据要拆分的列进行分组,可以使用groupby函数。3.对每个分组创建一个新的Excel sheet,可以使用pandas库的ExcelWriter对象。4.…

    python 2023年6月5日
    00
  • 解决python 读取excel时 日期变成数字并加.0的问题

    当使用Python读取Excel文件中的日期字段时,可能会遇到日期变成数字并加“.0”的问题。这是因为Excel中的日期被存储为浮点数,而Python读取Excel时默认情况下会把它们读取为浮点数。为了解决这个问题,可以按照以下步骤进行操作: 步骤一:安装pandas库 Pandas是一种数据处理库,提供了很多处理Excel表格的方法,可以解决读取Excel…

    python 2023年6月2日
    00
  • Python一行代码实现ChatGPT接入微信机器人

    下面我将详细讲解如何使用Python一行代码实现ChatGPT接入微信机器人的完整攻略。 1. 环境准备 首先,你需要创建一个微信公众号,然后在公众号后台开发者中心申请一个开发者账号,并获取到对应的AppID和AppSecret。 接下来,你需要安装下面两个Python库: pip install itchat pip install openai 其中,i…

    python 2023年5月23日
    00
  • python 使用csv模块读写csv格式文件的示例

    当需要处理大量的数据时,我们通常会使用csv格式的文件存储和读取数据,而Python中的csv模块就是一个很好地处理这种文件格式的工具。 使用csv模块读取csv格式文件1. 导入csv模块 import csv 打开csv文件 可以使用 Python 中的 open 函数打开 csv 文件,可以指定文件名、文件模式(读取模式 r、写入模式 w、追加模式 a…

    python 2023年5月20日
    00
  • 了不起的修仙模拟器在世真仙出门历练方法详解

    了不起的修仙模拟器在世真仙出门历练方法详解 背景 在了不起的修仙模拟器游戏中,除了修炼提升修为,世真仙也要出门历练,才能获得更多的修仙资源和任务,提高自身实力。本文将详细介绍世真仙在出门历练过程中的方法及注意事项。 出门历练方法 选择目的地 在出门历练前,首先需要选择一个适合自己修为等级和实力的目的地。可以通过查看地图和目的地介绍,了解不同地方的资源和危险程…

    python 2023年6月3日
    00
  • python使用prettytable内置库美化输出表格

    下面是详细讲解“python使用prettytable内置库美化输出表格”的完整攻略。 什么是prettytable prettytable是Python中的一个内置库,可以用于以一种标准化的方式输出ASCII表格。它可以将数据转换成表格形式,并支持对表格进行格式化、排序和筛选等操作,是一个非常实用的工具。 安装prettytable 在安装prettyta…

    python 2023年6月3日
    00
  • python多线程并发让两个LED同时亮的方法

    针对“python多线程并发让两个LED同时亮的方法”的完整攻略,我可以提供以下内容: 1. 使用GPIO控制LED灯 在开始之前,我们需要先明确控制LED灯需要用到的硬件和软件。 硬件:- Raspberry Pi(树莓派)开发板- 两个LED灯- 杜邦线- 面包板 软件:- Python语言- GPIO库 在树莓派上控制LED灯需要使用GPIO库,在终端…

    python 2023年5月19日
    00
  • Python爬虫实战之爬取京东商品数据并实实现数据可视化

    那我就为你讲解一下“Python爬虫实战之爬取京东商品数据并实现数据可视化”的完整攻略。 一、爬取京东商品数据 1.1 获取搜索链接 首先,我们需要打开京东首页,在搜索框中输入我们要爬取的商品关键词,比如“小米手机”。然后点击搜索,进入搜索结果页面。 接着,我们需要分析搜索结果页面的url,找到关键词“小米手机”在url中的表现。经过观察,我们发现搜索结果页…

    python 2023年6月2日
    00
合作推广
合作推广
分享本页
返回顶部