Python基础教程之正则表达式基本语法以及re模块

Python基础教程之正则表达式基本语法以及re模块

正则表达式是一种强大的工具,可以用于匹配、查找和替换文本中的模式。Python中,re模块提供一系列函数来操作正则表达式。本攻略将详细讲解正则表达式的基本语法、常用符号以及re模块的常用方法,包括search()、match()、findall()、sub()。

正则表达式基本语法

正则表达式由普通字符和特殊字符组成。普通字符包括大小写字母、数字和一些标点符号,特殊字符包括元字符和转义字符。

元字符是正则表达式中具有特殊含义的字符,包括:

  • .:配任意字符,除换行符。
  • *:匹配前面的字符零次或多次。
  • +:匹配前面的字符一次或多次。
  • ?:匹配前面的字符零次或一次。
  • `^:匹配字符串的开头。
  • $:匹配字符串的结尾。
  • []:匹配括号中的任意一个字符。
  • ():将括号中的字符作为一个整体进行匹配。
  • |:匹配两个或多个正则表达式中任一个。

转义字符用于将特殊字符转义为普通字符,包括\\d\s\w等。

下面是一个例子,演示如何使用正则表达式匹配字符串中的数字:

import re

text = 'The price is $1099.'
pattern = r'\d+'
result = re.findall(pattern, text)
if result:
    print('Matches found:', result)
else:
    print('Matches not found')

在上面的代码中,我们使用正则表达式\d+匹配字符串中的数字。\d表示匹配一个数字字符,+表示匹配一个或多个。findall()函数返回匹配的结果。运行代码后,输出结果为Matches found: ['1099']

re模块常用方法

re模块提供了一系列函数来操作正则表达式,包括:

  • re.search(pattern, string, flags=0):在字符串中搜索正则表达式第一个匹配项。
  • re.match(pattern, string, flags=0):在字符串的开头匹配正则表达式。
  • re.findall(pattern, string, flags=0):在字符串中查找正则表达式的所有匹配项。
  • re.sub(pattern, repl, string, count=0, flags=0):在字符串中搜索正则表达式的所有匹配项,并将其替换为指定的字符串。

其中,pattern表示正则表达式,string表示匹配字符串,flags表示正则表达式的匹配模式。

下面是一个例子,演示如何使用re.search()函数搜索字符串中的正则表达式:

import re

text = 'The quick brown fox jumps over the lazy dog.'
pattern = r'fox'
result = re.search(pattern, text)
if result:
    print('Match found:', result.group())
else:
    print('Match not found')

在上面的代码中,我们使用正则表达式fox匹配字符串中的foxsearch()用于在字符串中搜索正则表达式的第一个匹配项。运行代码后,结果为Match found: fox

示例1:匹配HTML标签中的文本内容

下面是一个例子,演示如何使用正则表达式匹配HTML标签中的文本内容:

import re

text = '<h1>Welcome to website</h1>'
pattern = r'<.*?>(.*?)</.*?>'
result = re.search(pattern, text)
if result:
    print('Match found:', result.group(1))
else:
    print('Match not found')

在上面的代码中,我们使用正则表达式<.*?>(.*?)<!--.*?-->匹配HTML标签中文本内容。<.*?>表示匹配一个或多个任意字符,.*?表示非贪婪匹配,()中的.*?匹配到的字符串作为捕获组。search()用于在字符串中搜索正表达式的第一个匹配项。运行代码,输出结果为`Match found: Welcome to my website。

示例2:提取网页中的图片链接

下面是另一个例子,演示如何使用正则表达式提取网页中的图片链接:

import re
import requests

url = 'https://www.example.com'
response = requests.get(url)
html = response.text
pattern = r'<img.*?src="(.*?)".*?>'
result = re.findall(pattern, html)
if result:
    print('Matches found:', result)
else:
    print('Matches not found')

在上面的代码中,我们使用正则表达式<img.*?src="(.*?)".*?>匹配网页中的图片链接。<img.*?>表示匹配img标签,src="(.*?表示匹配src属性中的链接,()表示匹配到的链接作为捕获组findall()函数返回所有匹配的结果。运行后,输出结果为匹配到的图片链接列表。

以上是Python基础教程之正则表达式基本语法以及re模块的常用方法。正则表达式是Python爬虫中常用的具,读者可以通过这些示例更好地理解正则表达式的应用。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python基础教程之正则表达式基本语法以及re模块 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • python在屏幕上点击特定按钮或图像效果实例

    下面我将为你详细讲解“python在屏幕上点击特定按钮或图像效果实例”的完整攻略。 1. 操作系统事件监听工具 在Python中,要实现屏幕上点击特定的按钮或图像效果,需要用到操作系统事件监听工具,比如Pyhook、Pygame等。 Pyhook Pyhook是一个操作系统事件监听工具,在Windows系统下实现钩取和处理鼠标与键盘事件。 下面是Pyhook…

    python 2023年6月13日
    00
  • Python中如何替换字典中的值

    当我们需要改变一个字典中某个键对应的值的时候,可以使用Python中的字典操作来实现。具体步骤如下: 步骤 确定要更改的键,假设它叫做key。 通过字典操作符“[]”访问键的值,并将需要替换的值赋予该键。如:dict[key] = new_value。 具体的实现代码如下: # 创建一个字典 dict1 = {‘a’: 10, ‘b’: 20, ‘c’: 3…

    python 2023年5月13日
    00
  • 使用C++扩展Python的功能详解

    使用C++扩展Python的功能,通常使用C++编写Python扩展模块,以便利用C++的高效性能、高速度和强大功能,提升Python的执行效率和扩展性。下面是使用C++扩展Python功能的完整攻略。 1. 安装相关工具和库 使用C++扩展Python,需要安装相关的工具和库。 首先,需要安装Python的开发环境,可以在官网下载对应系统的Python安装…

    python 2023年5月14日
    00
  • python3实现磁盘空间监控

    Python3实现磁盘空间监控攻略 在Linux系统中,我们经常需要监控磁盘的使用情况,以便及时发现磁盘的空间是否充足。Python3可以帮助我们实现磁盘空间的监控,使我们及时掌握磁盘的情况。 Step1:导入库 import psutil psutil库可以帮助我们获取系统的各种信息,如CPU、内存、磁盘使用情况等。 Step2:获取磁盘使用情况 disk…

    python 2023年6月2日
    00
  • 5款实用的python 工具推荐

    5款实用的Python工具推荐 1. virtualenv virtualenv是Python环境管理工具,用于解决不同项目使用不同依赖库版本的问题。它可以在同一台机器上创建多个Python环境,每个环境都拥有自己的依赖库。当一个新项目开始时,可以使用虚拟环境来避免与系统或其他项目的依赖库版本冲突。使用virtualenv的示例: 示例1 首先,安装virt…

    python 2023年5月19日
    00
  • Python读取图像并显示灰度图的实现

    好的。首先,需要明确的是,Python读取图像并显示灰度图的实现,可以通过Pillow和OpenCV两个Python库来实现。 安装依赖库 首先,需要安装相应的依赖库,此处以Windows系统为例,执行以下命令进行安装: 使用pip安装Pillow库: pip install Pillow 使用pip安装OpenCV库: pip install opencv…

    python 2023年5月18日
    00
  • 详解python编程slice与indices函数用法示例

    下面是详解Python编程Slice与indices函数用法示例的攻略: Slice的概念 在Python编程中,Slice是一种用来提取数据序列片段的方法。我们可以使用Slice提取一个列表或字符串中的一部分数据。使用Slice需要指定起始索引和结束索引,语法格式如下: seq[start:end] 其中,起始索引包含在Slice中,而结束索引不包含在Sl…

    python 2023年6月3日
    00
  • Python语法之精妙的十个知识点(装B语法)

    这里是完整攻略。 Python语法之精妙的十个知识点(装B语法) 1. 列表生成式(List Comprehensions) 列表生成式是用来快速生成一个列表的简洁语法。它的基本形式是:[expression for item in iterable]。其中 expression 是一个任意的 Python 表达式,item 是可迭代对象 iterable …

    python 2023年5月13日
    00
合作推广
合作推广
分享本页
返回顶部