自动化办公:手机号码提取器,使用正则表达式轻松提取文本文件中的手机号码

关于手机号码的提取,其实真正有用的部分就是re模块提供的正则表达式。使用正则表达式就能轻松地匹配到手机号码,由于功能比较简单这次并没有采用UI界面的方式来实现该功能。

【阅读全文】

file

第一步:写一个控制台输入函数。

path = input('请输入需要提取手机号码的文件路径(.txt):n')

第二步:读取包含手机号码的文本文件。

def read_text(path):
    '''
    读取文本文件
    :param path: 文本文件路径
    :return: 返回文本
    '''
    file = open(path,encoding="utf-8")
    text = file.read()
    file.close()
    return text

第三步:使用正则匹配文本中的手机号并返回。

import re  # 导入正则表达式处理模块

def get_phone(text):
    '''
    使用正则表达式提取文本中的手机号
    :param text: 原始文本
    :return: 手机号数组
    '''
    phones = re.findall(r'(13d{9}|14[5|7]d{8}|15d{9}|166{d{8}|17[3|6|7]{d{8}|18d{9})', text)
    return phones

第四步:执行功能函数。

text = read_text(path)  # 执行文本文件读取函数

result = get_phone(text)  # 执行文本正则匹配手机号函数

from pprint import pprint  # 导入pprint打印接口

pprint(result)

使用方法,启动.py文件之后输入包含手机号码的.txt文件路径就能完成手机号码的提取。

准备好包含手机号码的文本文件(.txt文件)。

我是公众号:[Python 集中营] 15934689023,其中包含手机号码。
我是公众号:[Python 集中营] 15934689024,其中包含手机号码。
我是公众号:[Python 集中营] 15934689025,其中包含手机号码。
我是公众号:[Python 集中营] 15934689026,其中包含手机号码。
我是公众号:[Python 集中营] 15934689027,其中包含手机号码。
我是公众号:[Python 集中营] 15934689028,其中包含手机号码。
我是公众号:[Python 集中营] 15934689029,其中包含手机号码。
我是公众号:[Python 集中营] 15934689030,其中包含手机号码。
我是公众号:[Python 集中营] 15934689031,其中包含手机号码。
我是公众号:[Python 集中营] 15934689032,其中包含手机号码。
我是公众号:[Python 集中营] 15934689033,其中包含手机号码。
我是公众号:[Python 集中营] 15934689034,其中包含手机号码。
我是公众号:[Python 集中营] 15934689035,其中包含手机号码。
我是公众号:[Python 集中营] 15934689036,其中包含手机号码。
我是公众号:[Python 集中营] 15934689037,其中包含手机号码。
我是公众号:[Python 集中营] 15934689038,其中包含手机号码。
我是公众号:[Python 集中营] 15934689039,其中包含手机号码。
我是公众号:[Python 集中营] 15934689040,其中包含手机号码。

返回结果是一个只有手机号码的数组文件。

['15934689023',
 '15934689024',
 '15934689025',
 '15934689026',
 '15934689027',
 '15934689028',
 '15934689029',
 '15934689030',
 '15934689031',
 '15934689032',
 '15934689033',
 '15934689034',
 '15934689035',
 '15934689036',
 '15934689037',
 '15934689038',
 '15934689039',
 '15934689040',
 '15934689041',
 '15934689042',
 '15934689043',
 '15934689044',
 '15934689045',
 '15934689046',
 '15934689047',
 '15934689048',
 '15934689049',
 '15934689050',
 '15934689051',
 '15934689052',
 '15934689053']

file

【往期精彩】

刚刚发现的可视化动态图库ipyvizzu,太好看了!

记住这些windows网络操作命令,轻松搞定自己的电脑网络!

word文档样式批量处理,久违了!

python 如何在多层循环中使用break/continue!

用python为心爱的人制作520照片墙,已成功做出效果图!

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:自动化办公:手机号码提取器,使用正则表达式轻松提取文本文件中的手机号码 - Python技术站

(0)
上一篇 2023年4月2日
下一篇 2023年4月2日

相关文章

  • 吐血整理python数据分析利器pandas的八个生命周期!

    这里从八个pandas的数据处理生命周期,整理汇总出pandas框架在整个数据处理过程中都是如何处理数据的。 【阅读全文】 也就是从pandas的数据表对象以及数据汇总、数据统计等等直到数据导出的八个处理过程来完成pandas使用的汇总处理。 首先,需要准备好将python非标准库导入进来,除了pandas之外一般伴随数据分析处理使用的还有numpy科学计算…

    Python开发 2023年4月2日
    00
  • python中最简单的turtle绘图:奥运五环

    为什么说奥运五环的绘制是最简单的,实际上它的绘制过程就是通过画笔画出五个相同大小的圆圈即可。不同的是圆圈的位置不同的。 阅读全文 开始之前,我特地去找了turtle的官网地址贴在下面,其实学习一个技术点官网的作用还是非常重要的。毕竟你在网上找到大量的资料都是二手资料。 因此,你可能并不了解这个技术点产生的初衷,最后,一个技术点就成以讹传讹。所以,鼓励大家学习…

    2023年4月2日
    00
  • word文档样式批量处理,久违了

    这里批量处理word文档的操作主要是通过python-docx非标准库实现的,通过定位到文档对象、再到段落、最后到一行文本从而完成针对文字对象的处理。 【阅读全文】 使用pip的方式安装python-docx pip install python-docx 将实现过程中需要的模块导入进来 from docx import Document # 文档处理对象 …

    2023年4月2日
    00
  • 零配置python日志,安装即用

    写了很多年的python日志都是使用内置的logging模块来完成的,使用时都需要经过繁琐的配置。有时候,还可能出现丢失日志的情况,直到loguru的出现。 【阅读全文】 loguru真的是十分的简单的,安装之后直接导入到python代码块中即可直接使用。 1、安装环境 我们还是按照pip的方式来进行安装,默认使用清华大学的镜像站。 pip install …

    2023年4月2日
    00
  • 知识汇总:python办公自动化应该学习哪些内容

    【阅读全文】 当前python自动化越来越受到欢迎,python一度成为了加班族的福音。还有大部分人想利用python自动化来简化工作,不知道从何处下手,所以,这里整理了一下python自动化过程中的各种办公场景以及需要用到的python知识点。 Excel办公自动化 python 针对excel表格处理的非标准库应该是最多的,这也是把excel办公自动化放…

    2023年4月2日
    00
  • 以后字符串中的字符提取校验就用这个了,效果不错!

    众所周知,python之所以很方便在一定程度上是因为随时都可能有人又创作了一个好用又方便的python非标准库。 【阅读全文】 正好有一个小需求需要校验一个python字符串中是否存在某种类型的字符,需求其实不难但是自己写的话又要耗时费力,可能还存在BUG需要测试。 于是想找找看有没有大佬已经实现这样的python非标准库,还真给找到了就是-txdpy,先安…

    Python开发 2023年4月2日
    00
  • 一个help函数解决了python的所有文档信息查看

    在python中的交互式命令行中提供了help函数来查询各个模块,或是公共函数,或是模块下的函数接口等都可以使用help函数来查看接口文档。 【阅读全文】 不过要查看这样的文档还是得有些英文功底的,包含函数、模块、变量的介绍都是通过英文来介绍的。 1、模块文档查看 打开控制台,这里使用的控制台工具是cmder,看起来比默认的cmd命令行好看的多。 比如说需要…

    2023年4月2日
    00
  • 两个库搞定python中引用javascript代码块/文件

    在一些特殊的python应用场景下需要逆向执行javascript代码块或者.js文件,比如:爬虫的时候下载下来的html页面中包含你要逆向执行的js代码块。 【阅读全文】 在python编程中提供了两个非标准库js2py与PyExecJS都能实现在python中运行代码块的效果的。 1、js2py的使用过程 js2py适用于js代码少量情况,如果用于很长的…

    2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部