Python自动化办公之手机号提取

yizhihongxing

你想了解“Python自动化办公之手机号提取”的完整攻略,我可以为你提供以下过程:

任务目标

本次任务的目标是从一份文档中提取有效的中国大陆手机号码。

工具准备

  • Python编程语言
  • re正则表达式模块
  • pandas数据分析库

步骤分解

  1. 读取文档

使用pandas库中的read_excel()函数可以读取Excel文件,该函数返回一个DataFrame对象。我们可以通过DataFrame对象的iloc属性来读取表格中特定的行和列。

  1. 正则表达式

中国大陆手机号码的格式是11位数字,以1开头。我们可以使用re模块中的正则表达式来匹配这个格式。具体实现请见代码块:

import re

pattern = re.compile(r'1[3-9]\d{9}')  # 匹配11位数字,以1开头的手机号码
  1. 提取手机号码

我们可以通过正则表达式来匹配文档中的所有电话号码,然后用列表来存储匹配到的结果。具体实现请见代码块:

import pandas as pd
import re

excel_file = pd.read_excel('data.xlsx', header=None)

data_list = []
for index, row in excel_file.iterrows():
    text = str(row[0])
    phone_numbers = pattern.findall(text)
    if phone_numbers:
        data_list.extend(phone_numbers)
  1. 输出结果

最后,我们可以将提取出来的手机号码保存到一个文件中。具体实现请见代码块:

with open('output.txt', 'w') as f:
    for phone_number in data_list:
        f.write(phone_number + '\n')

示例说明

假设有如下的Excel表格数据,我们需要从中提取手机号码:

A
1 顾客咨询电话 020-12345678
2 2018年订购记录,电话 18812345678
3 会员服务热线:0755-67891234 联系人:张三 13688888888
4 商务合作热线 13711112222

我们可以使用如下的代码来提取手机号码:

import pandas as pd
import re

pattern = re.compile(r'1[3-9]\d{9}')  # 匹配11位数字,以1开头的手机号码

excel_file = pd.read_excel('data.xlsx', header=None)

data_list = []
for index, row in excel_file.iterrows():
    text = str(row[0])
    phone_numbers = pattern.findall(text)
    if phone_numbers:
        data_list.extend(phone_numbers)

with open('output.txt', 'w') as f:
    for phone_number in data_list:
        f.write(phone_number + '\n')

print('手机号提取完成')

运行代码后,输出的结果是:

手机号提取完成

在同级目录下生成了一个名为output.txt的文件,里面包含了所有提取到的手机号码:

18812345678
13688888888
13711112222

如此我们就实现了Python自动化办公之手机号提取的完整攻略。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python自动化办公之手机号提取 - Python技术站

(0)
上一篇 2023年6月5日
下一篇 2023年6月5日

相关文章

  • python Paramiko使用示例

    Python Paramiko使用示例 什么是Paramiko? Paramiko 是 Python 实现的 SSH 客户端,提供了 SSH2 协议的完整实现。它支持加密和身份验证的混合模式,并可用于同时处理多个客户端连接。 安装Paramiko 你可以在终端中使用Python包管理器pip来安装Paramiko,只需要在命令行输入pip install P…

    python 2023年6月2日
    00
  • Python异常对代码运行性能的影响实例解析

    Python异常对代码运行性能的影响实例解析 在Python编程中,异常(Exception)是一种常见的编程错误和问题处理方式。然而,异常处理可能会对代码的运行性能产生负面影响。本文将通过两个示例来说明Python异常对代码运行性能的影响。 示例1: try-except代码块执行效率 下面的代码实现了“Fizz Buzz”游戏,这是一款经典的编程练习题。…

    python 2023年5月13日
    00
  • 如何从 VS Code 中的本地 python 包导入?

    【问题标题】:How to import from local python packages in VS Code?如何从 VS Code 中的本地 python 包导入? 【发布时间】:2023-04-02 13:05:02 【问题描述】: 我的项目结构是这样的: – my_pkg setup.py README.md – my_pkg __init__…

    Python开发 2023年4月8日
    00
  • 在python中将字符串转为json对象并取值的方法

    在 Python 中将字符串转为 JSON 对象并取值的方法可以通过使用 json 模块来实现。具体步骤如下: Step 1:导入 json 模块 在使用 json 模块之前,需要先导入该模块。导入方式如下: import json Step 2:使用 json.loads() 方法将字符串转为 JSON 对象 通过使用 json.loads() 方法,可以…

    python 2023年6月3日
    00
  • python语言的优势是什么

    以下是“Python语言的优势是什么”的完整攻略: 一、问题描述 Python是一种高级编程语言,具有简单易学、可读性强、功能强大等优点。本文将详细讲解Python语言的优势是什么。 二、解决方案 2.1 Python语言的优势 Python语言具有以下优势: 简单易学:Python语言的语法简单明了,易于学习和使用。Python语言的代码可读性强,代码结构…

    python 2023年5月14日
    00
  • Python中字符串对象语法分享

    Python中字符串对象语法分享 什么是字符串对象 字符串对象是Python中用于表示文本和字符序列的数据类型。在Python中,用一对单引号或双引号括起来的任何文本都可以作为字符串对象,例如: string1 = "Hello, world!" string2 = ‘Python for Beginners’ 字符串对象的基本操作 字符…

    python 2023年6月3日
    00
  • Python 时间操作time详情

    标题:Python 时间操作time详情 时间表示方法 在Python中,时间的表示方法有两种: 时间戳 格式化时间字符串 时间戳(timestamp)是指从1970年1月1日00:00:00到当前时间的秒数,可以用time.time()函数获取。格式化时间字符串则是将时间按照某种格式进行字符串表示,通常使用time.strftime()函数将时间戳转换成格…

    python 2023年6月2日
    00
  • 如何在 Python 3.7 中提取字符串开头的数字?

    【问题标题】:How do I extract the number at the beginning of a string in Python 3.7?如何在 Python 3.7 中提取字符串开头的数字? 【发布时间】:2023-04-04 17:24:01 【问题描述】: 我正在使用 Python 3.7。我很难从字符串的开头提取数字。字符串是从 H…

    Python开发 2023年4月6日
    00
合作推广
合作推广
分享本页
返回顶部