常用正则表达式 整理篇

yizhihongxing

常用正则表达式整理篇攻略

正则表达式是一种用于匹配文本的模式。在实际应用中,我们经常需要使用正表达式来解析HTML、XML等文本数据。本攻略将详细讲解常用正则表达式的整理,包括正则表达式的基本语法、常用的正则表达式模式、以及如何在Python中使用正则表达式。

正则表达式基本语法

正则表达式是一种用于匹配文本的模式。在Python中,我们可以使用re模块来使用正则表达式。下面是一些常用的正则表达式基本语法:

  • .:匹配任意字符,除了换行符。
  • *:匹配前面的字符零次或多次。
  • +:匹配前面的字符一次或多。
  • ?:匹配前面的字符零次或一次。
  • ^:匹配字符串的开头。
  • $:匹配字符串的结尾。
  • []:匹配括号中的任意一个字符。
  • |:匹配左右两边任意一个表达式。
  • ():分组,可以用于提取匹配的子字符串。

常用正则表达式模式

在Python中,我们经常需要正则表达式来解析HTML、XML等文本数据。下面是一些常用的正则表达式模式:

  • 匹配HTML标签:<[^>]+>
  • 匹配HTML标签中的属性:[a-zA-Z]+=\"[^\"]*\"
  • 匹配HTML标签中的文本:>([^<]+)<
  • 匹配URL:http[s]?:(?:[a-zA-Z0-9]|[$@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+
  • 匹配邮箱地址:[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
  • 匹配手机号码:1[3-9]\d{9}
  • 匹配身份证号码:\d{17}[\d|x]|\d{15}
  • 匹配IP地址:\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}

在Python中使用正则表达式

在Python中,我们可以使用re模块来使用正则表达式。下面是一个例子,演示如何使用正则表达式:

import re

text = 'Hello, world!'
pattern = r'world'
result = re.search(pattern, text)
if result:
    print('Match found:', result.group())
else:
    print('Match not found')

在上面的代码中,我们使用正则表达式world进行匹配。然后,我们使用search()函数进行匹配。search()函数返回第一个匹配的结果。如果匹配成功,我们使用group()函数获取匹配到的文本。运行代码后,结果为Match found: world

下面是另一个例子,演示如何使用正则表达式提取URL:

import re

text = 'Visit my website at http://www.example.com'
pattern = r'http[s]?://(?:[a-zA-Z0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+'
result = re.search(pattern, text)
if result:
    print('Match found:', result.group())
else:
    print('Match not found')

在上面的代码中,我们使用正则表达式http[s]?://(?:[a-zA-Z0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+进行匹配。然后,我们使用search()函数进行匹配。search()函数返回第匹配的结果。如果匹配成功,我们使用group()函数获取匹配到的文本。运行代码后,结果为Match found: http://www.example.com

示例说明

示例1:从字符串中提取整数

下面是一个例子,演示如何从字符串提取整数:

import re

text = 'The price is $10.'
pattern = r'\d+'
result = re.findall(pattern, text)
print(result)

在上面的代码中,我们使用正则表达式\d+进行匹配,然后使用findall()函数进行提取。findall()函数返回所有匹配的结果。运行代码后,结果为['10']

示例2:从字符串中提取浮点数

下面是一个例子,演示如何从字符串中提取浮点数:

import re

text = 'The temperature is -3.14 degrees Celsius'
pattern = r'-?\d+\.\d+'
result = re.findall(pattern, text)
print(result)

在上面的代码中,我们使用正则表达式-?\d+\.\d+进行匹配,然后使用findall()函数进行提取findall()函数返回所有匹配的结果。运行代码后,结果为['-3.14']

以上是常用正则表达式整篇攻略的完整内容。在实际应用中,我们可以根据具体情况选择合适的正则表达式模式,以便快速、准确地解析HTML、XML等文本数据。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:常用正则表达式 整理篇 - Python技术站

(1)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Python 模块和类 – AttributeError:模块没有属性

    【问题标题】:Python Module and Class – AttributeError: module has no attributePython 模块和类 – AttributeError:模块没有属性 【发布时间】:2023-04-06 04:23:01 【问题描述】: 我是 python 新手,我正在尝试创建一个模块和类。 如果我尝试导入my…

    Python开发 2023年4月7日
    00
  • python基础之循环语句

    Python是一种高级编程语言,内置了很多流行的循环语句,可以用来控制程序的流程和执行次数。在Python中,循环语句分为两种:for循环和while循环,分别适用于不同的场景。 for循环 for循环是Python最常用的循环语句之一,通常用于遍历序列和迭代器,执行一定数量的次数。for循环的语法格式如下: for 变量 in 序列: 循环体语句 其中,变…

    python 2023年5月31日
    00
  • Python中缓存lru_cache的基本介绍和讲解

    Python中缓存lru_cache的基本介绍和讲解 什么是lru_cache lru_cache是Python中标准库functools中的一个函数,用于提高函数的运行效率,可以实现对函数结果进行缓存。lru_cache表示Least Recent Use,也就是最近最少使用的意思,它会保留最近使用次数最多的n个函数调用结果。 lru_cache的使用 l…

    python 2023年6月3日
    00
  • Python教程之基本运算符的使用(上)

    当然,我很乐意为您提供详细的Python基本运算符攻略。 标题 作为一个好的文章,我们首先需要添加几个标题,以便读者能够更好地理解和找到自己感兴趣的部分: 一、Python教程之基本运算符的使用(上) 1.1 算术运算符 1.2 比较运算符 1.3 赋值运算符 1.4 逻辑运算符 1.5 位运算符 1.6 成员运算符 1.7 身份运算符 正文 现在我们进入正…

    python 2023年5月30日
    00
  • python实现两个dict合并与计算操作示例

    下面我为您详细讲解下“Python实现两个dict合并与计算操作示例”的完整攻略。 一、两个dict的合并操作 1.使用“+”符号 我们可以通过将两个dict使用“+”符号拼接在一起的方式来实现合并操作。 示例代码如下: dict1 = {‘a’: 1, ‘b’: 2} dict2 = {‘c’: 3, ‘d’: 4} dict3 = dict1 + dic…

    python 2023年6月3日
    00
  • 利用Python脚本写端口扫描器socket,python-nmap

    什么是端口扫描器 端口扫描器是一种工具,其主要作用是分析目标主机开放了哪些端口。端口扫描器通过向目标主机发送网络请求,判断响应结果来确认端口是否是开放状态。一般来说,端口扫描器会通过一系列的算法或规则发现目标主机开放了哪些端口。其中常用的扫描方式有全端口扫描,以及针对特定端口实施的扫描方式。 Python脚本实现端口扫描器 Python作为一门功能非常强大的…

    python 2023年6月6日
    00
  • Python线性方程组求解运算示例

    以下是关于“Python线性方程组求解运算示例”的完整攻略: 简介 线性方程组是一组包含线性方程的方程组,其中每个方程都是形如a1x1 + a2x2 + … + anxn = b的形式。在本教程中,我们将介绍如何使用Python求解线性方程组。 Python线性方程组求解 Python中有多种方法可以求解线性方程组,包括numpy库中的linalg.so…

    python 2023年5月14日
    00
  • Python3.10 Generator生成器Coroutine原生协程详解

    Python3.10 Generator生成器Coroutine原生协程详解 Python3.10中引入了一些新的特性,包括Generator生成器和Coroutine原生协程。本文将详细讲解这两个特性的用法,并提供两个示例来说明它们的使用。 Generator生成器 Generator生成器的功能 Generator生成器是Python中的一种特殊的函数,…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部