这个Python读取文件的方法,堪称天花板级别…

序言

哈喽兄弟们,今天咱们来了解一下 fileinput 。

说到fileinput,可能90%的码农表示没用过,甚至没有听说过。

这不奇怪,因为在python界,既然open可以走天下,何必要fileinput呢?

但是,今天我还是要介绍fileinput这个方法,因为太奈斯了。

不止是香。是真香!

接下来,就跟着我,一起fileinput,对,就是这个feel。

这个Python读取文件的方法,堪称天花板级别...

正文

1、方法介绍

基本用法

先来看一下fileinput的基本功能:

  • fileinput.filename():返回当前被读取的文件名。
    —>在第一行被读取之前,返回 None。

  • fileinput.fileno():返回以整数表示的当前文件“文件描述符”。
    —>当未打开文件时(处在第一行和文件之间),返回 -1。

  • fileinput.lineno():返回已被读取的累计行号。
    —>在第一行被读取之前,返回 0。在最后一个文件的最后一行被读取之后,返回该行的行号。

  • fileinput.filelineno():返回当前文件中的行号。
    —>在第一行被读取之前,返回 0。
    —>在最后一个文件的最后一行被读取之后,返回此文件中该行的行号。

进阶用法

  • fileinput.isfirstline():如果刚读取的行是其所在文件的第一行则返回 True,否则返回 False。

  • fileinput.isstdin():如果最后读取的行来自 sys.stdin 则返回 True,否则返回 False。

  • fileinput.nextfile():关闭当前文件以使下次迭代将从下一个文件(如果存在)读取第一行;不是从该文件读取的行将不会被计入累计行数。直到下一个文件的第一行被读取之后文件名才会改变。
    —>在第一行被读取之前,此函数将不会生效;它不能被用来跳过第一个文件。
    —>在最后一个文件的最后一行被读取之后,此函数将不再生效。

  • fileinput.close():关闭序列。

2、 默认读取

代码示例

import fileinput

'当 Python 脚本没有传入任何参数时,fileinput 默认会以 stdin 作为输入源'
for line in fileinput.input():
    print(f'{line}')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

你输入的内容,程序都会读取并再输出。

俗称:复读机

3、处理一个文件

代码示例

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('output.txt',)) as file:
    for line in file:
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行:{line}',end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

解析:

  • fileinput 有且仅有这两种读取模式:‘r’,‘rb’;
  • fileinput.input() 默认使用 mode=‘r’ 的模式读取文件,如果你的文件是二进制的,可以使用mode=‘rb’ 模式。

4、处理批量文件

多文件序号连续排序

调用方法

  • fileinput.lineno()方法

代码示例

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('output.txt','input.txt')) as file:
    for line in file:
        #fileinput.lineno() 把两个文件的整合陈一个文件对象file,需要排序输出
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')
        
        # fileinput.filelineno()两个文件单独读取,需要单独排序
        print(f'{fileinput.filename()} 第{fileinput.filelineno()}行: {line}', end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

多文件序号单独排序

调用方法

  • fileinput.filelineno()方法

代码示例

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('test1.txt','test2.txt')) as file:
    for line in file:       
        # fileinput.filelineno()两个文件单独读取,需要单独排序
        print(f'{fileinput.filename()} 第{fileinput.filelineno()}行: {line}', end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

与glob配合用法

在颜值的时代,上面的输出样式,已经无法满足我们的需要了,于是乎,我们就想到了glob。

代码示例

import fileinput
import glob

#glob 匹配te开头的txt文件
for line in fileinput.input(glob.glob("te*.txt")):
    if fileinput.isfirstline():
        #输出读取文件
        print('='*10,f'读取文件{fileinput.filename()}','='*10)
        #fileinput.filelineno()方法读取
    print(str(fileinput.filelineno())+ ':'+line.upper(),end='')

 

运行结果
这个Python读取文件的方法,堪称天花板级别...

 

 

就这颜值,哪个小姐姐能不喜欢呢。

5、读取与备份

调用方法

  • fileinput.input 的backup 参数,可以指定备份的后缀名,比如 .bak

代码示例

import fileinput

#触发backup的动作,源文件内容被修改,对源文件进行backup
with fileinput.input(files=("test1.txt",), backup=".bak",inplace=1) as file:
    for line in file:
        print(line.rstrip().replace('111111', '222222'))
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

6、重定向替换

解析

  • 上面的例子, 用到了 inplace参数,表示是否将标准输出的结果写回文件,默认不取代。

代码示例:

import fileinput

#触发backup的动作,源文件内容被修改,对源文件进行backup
with fileinput.input(files=("test2.txt",), inplace=True) as file:
    print("[INFO] task is started...")
    for line in file:
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')
    print("[INFO] task is closed...")

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

通过运行结果,可以看到:

  • 在 for 循环体内的 print 内容会写回到原文件中了。
  • 而在 for 循环体外的 print 则没有变化。

7、进阶

openhook含义解析

  • 在 fileinput.input() 中有一个 openhook 的参数,它支持用户传入自定义的对象读取方法;
  • 如果没有传入任何勾子,fileinput 默认使用的是 open 函数;

方法介绍

fileinput 内置了两种勾子

1、fileinput.hook_compressed(filename, mode)

  • 使用 gzip 和 bz2 模块透明地打开 gzip 和 bzip2 压缩的文件(通过扩展名 ‘.gz’ 和 ‘.bz2’ 来识别);
  • 如果文件扩展名不是 ‘.gz’ 或 ‘.bz2’,文件会以正常方式打开(即使用 open() 并且不带任何解压操作);
  • 使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_compressed)

2、fileinput.hook_encoded(encoding, errors=None)

  • 返回一个通过 open() 打开每个文件的钩子,使用给定的 encoding 和 errors 来读取文件。
  • 使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_encoded(“utf-8”, “surrogateescape”))

示例实战

假如我想要使用 fileinput 来读取网络上的文件,思路:

  • 先使用 requests 下载文件到本地
  • 再使用 open 去读取它;
def online_open(url, mode):
    import requests
    r = requests.get(url) 
    filename = url.split("/")[-1]
    with open(filename,'w') as f1:
        f1.write(r.content.decode("utf-8"))
    f2 = open(filename,'r')
    return f2

 

直接将这个函数传给 openhook 即可:

import fileinput
file_url = 'https://www.csdn.net/robots.txt'
with fileinput.input(files=(file_url,), openhook=online_open) as file:
    for line in file:
        print(line, end="")

 

代码整合:

def online_open(url, mode):
    import requests
    r = requests.get(url)
    filename = url.split("/")[-1]
    with open(filename,'w') as f1:
        f1.write(r.content.decode("utf-8"))
    f2 = open(filename,'r')
    return f2

import fileinput
file_url = 'https://www.csdn.net/robots.txt'
with fileinput.input(files=(file_url,), openhook=online_open) as file:
    for line in file:
        print(line, end="")
# Python学习交流群 279199867

 

运行结果

这个Python读取文件的方法,堪称天花板级别...

 

 

总结

关于fileinput的介绍,也就介绍到这里。

fileinput本身是对 open 函数的再次封装,所以在读取的cc部分,就比open显得更专业,更优雅,这也是仅限于读取的方面。
在写的方面,相对于open,就不是那么的强悍。

归根结底,fileinput还是一个不错的方法。值得你拥有。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:这个Python读取文件的方法,堪称天花板级别… - Python技术站

(0)
上一篇 2023年4月2日 下午5:06
下一篇 2023年4月2日 下午5:06

相关文章

  • Python统计文件中词出现的频率,非常简单,大神就不要点了

    兄弟们,今天咱们用Python来统计文件中词出现的频率。 你需要准备 Python pycharm 准备好的txt文件 知识点 文件读写 基础语法 字符串处理 循环遍历 代码展示 # 导入系统包 import platform # 我还给大家准备了这些资料:Python视频教程、100本Python电子书、基础、爬虫、数据分析、web开发、机器学习、人工智能…

    Python开发 2023年4月2日
    00
  • Python爬虫实战:批量爬取百度图片

    众所周知,某度本身就是最大的爬虫脚本,那么纯纯的去某个网站找壁纸,还不如去某度图片直接找,瞬间格局打开! 话不多说,直接用Python来开发一下此处资源! 开发环境 & 第三方模块 环境 解释器版本 >>> python 3.8代码编辑器 >>> pycharm 2021.2 模块 requests # 发送请求 …

    Python开发 2023年4月2日
    00
  • 利用Python生成随机密码,灰常简单

    兄弟们,今天我们来用Python生成随机密码试试~ 知识点 文件读写 基础语法 字符串处理 字符拼接   代码解析 导入模块 import platform import string import random # 我还给大家准备了这些资料:Python视频教程、100本Python电子书、基础、爬虫、数据分析、web开发、机器学习、人工智能、面试题、Py…

    Python开发 2023年4月2日
    00
  • Python基础巩固:如何同时遍历多个序列

    哈喽兄弟们,又是巩固复习基础知识的一天~ 今天来实现一下如何同时遍历多个序列 一、实战场景 实战场景: 如何同时遍历多个序列。 二、主要知识点 同时遍历多个序列zip 函数 三、菜鸟实战 马上安排! 1、创建 python 文件 # 导入系统包 import platform # 我还给大家准备了海量资料:Python视频教程、100本Python电子书、基…

    Python开发 2023年4月2日
    00
  • Python之字典遍历元素(4种方式)

    第一种:for in girl_dict= {“China”: “小美”, “Japan”: “图多天光”, “Korea”: “斯密达美”} for everyKey in girl_dict: print (“key:” + everyKey + “value:” + girl_dict[everyKey])   输出结果 key:japan value…

    Python开发 2023年3月31日
    00
  • 使用Python计算个人所得税

    企业发放的奖金根据利润提成。 利润(I)低于或等于10万元时,奖金可提10%; 利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可提成7.5%; 20万到40万之间时,高于20万元的部分,可提成5%; 40万到60万之间时高于40万元的部分,可提成3%; 60万到100万之间时,高于60万元的部分,可提成1.5%, 高于…

    Python开发 2023年4月2日
    00
  • Python实现将文本数据批量导入Excel表格,并按格式保存

    本文实现用Python将文本文件自动保存到Excel表格里面去。 需求 将锦江区.txt 文件中的数据整理到 锦江区.xlsx 的 锦江区 sheet ; 将推荐菜字段丢弃(保留前面14个字段) ; 将人均消费中的 ¥ 符号去掉,如果价格为空整条数据都不要; 成果展示 txt文本部分数据 效果 稍微打了点码,尊重一下别人。 代码展示 import openp…

    Python开发 2023年4月2日
    00
  • 用Python做一个中秋抢购月饼的脚本

    序言 每逢佳节倍思亲,想买个东西给家里,结果发现手速不够,网速不够快,没有时间下单等等各种原因导致最后想买的东西售罄了… 甚至跟你一起抢购的可能是脚本,太真实了! 今天就给大家分享一个python版抢购月饼的脚本,我们要用魔法打败魔法!话不多说,直接开搞! 准备工作 今天要用的是一个测试工具的库:Selenium Selenium是一个用于测试网站的自动化测…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部