这个Python读取文件的方法,堪称天花板级别…

序言

哈喽兄弟们,今天咱们来了解一下 fileinput 。

说到fileinput,可能90%的码农表示没用过,甚至没有听说过。

这不奇怪,因为在python界,既然open可以走天下,何必要fileinput呢?

但是,今天我还是要介绍fileinput这个方法,因为太奈斯了。

不止是香。是真香!

接下来,就跟着我,一起fileinput,对,就是这个feel。

这个Python读取文件的方法,堪称天花板级别...

正文

1、方法介绍

基本用法

先来看一下fileinput的基本功能:

  • fileinput.filename():返回当前被读取的文件名。
    —>在第一行被读取之前,返回 None。

  • fileinput.fileno():返回以整数表示的当前文件“文件描述符”。
    —>当未打开文件时(处在第一行和文件之间),返回 -1。

  • fileinput.lineno():返回已被读取的累计行号。
    —>在第一行被读取之前,返回 0。在最后一个文件的最后一行被读取之后,返回该行的行号。

  • fileinput.filelineno():返回当前文件中的行号。
    —>在第一行被读取之前,返回 0。
    —>在最后一个文件的最后一行被读取之后,返回此文件中该行的行号。

进阶用法

  • fileinput.isfirstline():如果刚读取的行是其所在文件的第一行则返回 True,否则返回 False。

  • fileinput.isstdin():如果最后读取的行来自 sys.stdin 则返回 True,否则返回 False。

  • fileinput.nextfile():关闭当前文件以使下次迭代将从下一个文件(如果存在)读取第一行;不是从该文件读取的行将不会被计入累计行数。直到下一个文件的第一行被读取之后文件名才会改变。
    —>在第一行被读取之前,此函数将不会生效;它不能被用来跳过第一个文件。
    —>在最后一个文件的最后一行被读取之后,此函数将不再生效。

  • fileinput.close():关闭序列。

2、 默认读取

代码示例

import fileinput

'当 Python 脚本没有传入任何参数时,fileinput 默认会以 stdin 作为输入源'
for line in fileinput.input():
    print(f'{line}')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

你输入的内容,程序都会读取并再输出。

俗称:复读机

3、处理一个文件

代码示例

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('output.txt',)) as file:
    for line in file:
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行:{line}',end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

解析:

  • fileinput 有且仅有这两种读取模式:‘r’,‘rb’;
  • fileinput.input() 默认使用 mode=‘r’ 的模式读取文件,如果你的文件是二进制的,可以使用mode=‘rb’ 模式。

4、处理批量文件

多文件序号连续排序

调用方法

  • fileinput.lineno()方法

代码示例

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('output.txt','input.txt')) as file:
    for line in file:
        #fileinput.lineno() 把两个文件的整合陈一个文件对象file,需要排序输出
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')
        
        # fileinput.filelineno()两个文件单独读取,需要单独排序
        print(f'{fileinput.filename()} 第{fileinput.filelineno()}行: {line}', end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

多文件序号单独排序

调用方法

  • fileinput.filelineno()方法

代码示例

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('test1.txt','test2.txt')) as file:
    for line in file:       
        # fileinput.filelineno()两个文件单独读取,需要单独排序
        print(f'{fileinput.filename()} 第{fileinput.filelineno()}行: {line}', end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

与glob配合用法

在颜值的时代,上面的输出样式,已经无法满足我们的需要了,于是乎,我们就想到了glob。

代码示例

import fileinput
import glob

#glob 匹配te开头的txt文件
for line in fileinput.input(glob.glob("te*.txt")):
    if fileinput.isfirstline():
        #输出读取文件
        print('='*10,f'读取文件{fileinput.filename()}','='*10)
        #fileinput.filelineno()方法读取
    print(str(fileinput.filelineno())+ ':'+line.upper(),end='')

 

运行结果
这个Python读取文件的方法,堪称天花板级别...

 

 

就这颜值,哪个小姐姐能不喜欢呢。

5、读取与备份

调用方法

  • fileinput.input 的backup 参数,可以指定备份的后缀名,比如 .bak

代码示例

import fileinput

#触发backup的动作,源文件内容被修改,对源文件进行backup
with fileinput.input(files=("test1.txt",), backup=".bak",inplace=1) as file:
    for line in file:
        print(line.rstrip().replace('111111', '222222'))
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

6、重定向替换

解析

  • 上面的例子, 用到了 inplace参数,表示是否将标准输出的结果写回文件,默认不取代。

代码示例:

import fileinput

#触发backup的动作,源文件内容被修改,对源文件进行backup
with fileinput.input(files=("test2.txt",), inplace=True) as file:
    print("[INFO] task is started...")
    for line in file:
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')
    print("[INFO] task is closed...")

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

通过运行结果,可以看到:

  • 在 for 循环体内的 print 内容会写回到原文件中了。
  • 而在 for 循环体外的 print 则没有变化。

7、进阶

openhook含义解析

  • 在 fileinput.input() 中有一个 openhook 的参数,它支持用户传入自定义的对象读取方法;
  • 如果没有传入任何勾子,fileinput 默认使用的是 open 函数;

方法介绍

fileinput 内置了两种勾子

1、fileinput.hook_compressed(filename, mode)

  • 使用 gzip 和 bz2 模块透明地打开 gzip 和 bzip2 压缩的文件(通过扩展名 ‘.gz’ 和 ‘.bz2’ 来识别);
  • 如果文件扩展名不是 ‘.gz’ 或 ‘.bz2’,文件会以正常方式打开(即使用 open() 并且不带任何解压操作);
  • 使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_compressed)

2、fileinput.hook_encoded(encoding, errors=None)

  • 返回一个通过 open() 打开每个文件的钩子,使用给定的 encoding 和 errors 来读取文件。
  • 使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_encoded(“utf-8”, “surrogateescape”))

示例实战

假如我想要使用 fileinput 来读取网络上的文件,思路:

  • 先使用 requests 下载文件到本地
  • 再使用 open 去读取它;
def online_open(url, mode):
    import requests
    r = requests.get(url) 
    filename = url.split("/")[-1]
    with open(filename,'w') as f1:
        f1.write(r.content.decode("utf-8"))
    f2 = open(filename,'r')
    return f2

 

直接将这个函数传给 openhook 即可:

import fileinput
file_url = 'https://www.csdn.net/robots.txt'
with fileinput.input(files=(file_url,), openhook=online_open) as file:
    for line in file:
        print(line, end="")

 

代码整合:

def online_open(url, mode):
    import requests
    r = requests.get(url)
    filename = url.split("/")[-1]
    with open(filename,'w') as f1:
        f1.write(r.content.decode("utf-8"))
    f2 = open(filename,'r')
    return f2

import fileinput
file_url = 'https://www.csdn.net/robots.txt'
with fileinput.input(files=(file_url,), openhook=online_open) as file:
    for line in file:
        print(line, end="")
# Python学习交流群 279199867

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

总结

关于fileinput的介绍,也就介绍到这里。

fileinput本身是对 open 函数的再次封装,所以在读取的cc部分,就比open显得更专业,更优雅,这也是仅限于读取的方面。
在写的方面,相对于open,就不是那么的强悍。

归根结底,fileinput还是一个不错的方法。值得你拥有。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:这个Python读取文件的方法,堪称天花板级别… - Python技术站

(0)
上一篇 2023年4月2日 下午5:06
下一篇 2023年4月2日 下午5:06

相关文章

  • 【Python基础教程】类的定义和使用

    哈喽兄弟们,今天咱们分享一下类的定义和使用。   在Python中,类表示具有相同属性和方法的对象的集合。在使用类时,需要先定义类,然后再创建类的实例,通过类的实例就可以访问类中的属性和方法了。 1、定义类 在Python中,类的定义使用class关键字来实现,语法如下: class ClassName: “”“类的帮助信息”“” # 类文本字符串 stat…

    Python开发 2023年4月2日
    00
  • Python实战小案例:如何读取文件并统计文件中的数值

    哈喽兄弟们,今天浅浅的实战一下,如何用Python计算文件内最大数与最小数平均值~ 一、实战场景 给定一个包含整数的文件,每行数字小于 200,统计文件中的最大最小值和平均值,并将结果写入文件中。 创建一个txt文件,随机输入几行数字,保存命名为 input 即可。 二、主要知识点 文件读写 基础语法 单行注释和多行注释 三、代码实战 马上安排! 1、创建 …

    Python开发 2023年4月2日
    00
  • Python一键读取文件中英文单词数量

    一、 序言 今天用Python来试试,对一个文件里面的英文单词数量进行快速统计,告别传统计数方式。 目标文件 我也不知道多少个,瞎复制的~ 二、涉及知识点 文件读写 基础语法 字符串分割   三、代码实践 首先我们创建一个Python文件 导入我们需要用到的模块 import platform # 我给大家准备了这些资料:Python视频教程、100本Pyt…

    Python开发 2023年4月2日
    00
  • Python写一个自动发送直播弹幕的工具,非常好用!

    昨晚回家,表弟在看LOL直播,看得我气不打一处来,差点就想锤他。 身为程序员的表弟,看直播发弹幕居然还在手动发,当时我就用Python写了一个自动发送弹幕的脚本送给他用。 好了话不多说,我们直接开搞! 先看看效果 名字我就打码了,当然名字不是关键,我直接截图展示算了,GIF的话,太麻烦了。 接下来我们要准备好你想发送的弹幕内容 这个我都是随便打的,大家可以自…

    Python开发 2023年3月31日
    00
  • Python批量爬取大众点评数据

    众所周知,某点评是一直有JS加密的,所以关于它的外包一直都很贵,有些公司甚至用来面试,可见他的难度。 但是吧,最近他好像没有加密了,这~ 不值钱了啊! 那当时就忍不住了,就得用Python开始整活了!     话不多说,让我们上代码! 全部代码 今天就没那么多步骤了,直接上代码! import requests import parsel url = ‘ht…

    2023年4月2日
    00
  • 用Python计算从1到500之间偶数的和

    兄弟们,今天来实现一下用Python计算1到500的偶数总和,灰常简单,检验一下大家基础学的怎么样! 涉及到的知识点 range 使用 for 循环 推导式 函数调用 # 这应该都学过吧,如果刚刚接触Python,基础都还没怎么学的话,加Q群 279199867,领取2022最新的Python视频教程、100本Python电子书、基础、爬虫、数据分析、web…

    Python开发 2023年4月2日
    00
  • Python实现视频自动打码功能

    我们在观看视频的时候,有时候会出现一些奇怪的马赛克,影响我们的观影体验,那么这些马赛克是如何精确的加上去的呢? 本次我们就来用Python实现对视频自动打码! 准备工作 环境咱们还是使用 Python3.8 和 pycharm2021 即可 实现原理 将视频分为音频和画面; 画面中出现人脸和目标比对,相应人脸进行打码; 处理后的视频添加声音; 模块 手动安装…

    Python开发 2023年4月2日
    00
  • 新手学习Python需要知道的100个小技巧,加班一晚上终于整理出来了!

    哈喽兄弟们,今天给大家分享一下Python初学需要知道的100个小技巧~ 1、for循环中的else条件这是一个for-else方法,循环遍历列表时使用else语句。下面举个例子,比如我们想检查一个列表中是否包含奇数。那么可以通过for循环,遍历查找。 numbers = [2, 4, 6, 8, 1] for number in numbers: if n…

    2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部