python常用标准库(os系统模块、shutil文件操作模块)

常用的标准库

系统模块

import os

系统模块用于对系统进行操作。

常用方法

os模块的常用方法有数十种之多,本文中只选出最常用的几种,其余的还有权限操作、文件的删除创建等详细资料可以参考官方文档。

system -- 执行系统命令

参数的数据类型是字符串格式,内容是系统指令。执行时,直接返回系统输出。

import os

os.system('ifconfig')  # Linux系统shell命令
os.system('ipconfig')  # Windows系统dos命令
popen -- 执行系统命令

在使用system执行系统命令的时候,发现在windows系统下执行命令时,中文字符发生了乱码!这是因为windows为减少占用,对中文系统使用GB格式编码,而python中默认使用的UTF-8编码,编码不兼容导致了乱码问题。

popen也可以执行系统指令,但是和system的工作方式不一样。

popen执行系统指令之后返回对象,通过内置方法read读出字符串,这个过程中read方法自动的将其它编码转换成为了UTF-8格式,所以popen相比system有更高的可读性和兼容性。

而在实际的使用过程中,发现popen不存在阻塞,即在执行一些长时间系统任务的时候,不会等待系统任务结束,python代码就会继续执行,在某些场景下会导致问题的出现。比如在我的一个场景中,要将一个文件夹中的文件删除,之后在重写一份文件,使用popen导致文件还没有删除,而代码继续执行使新文件已经写好,而这个时候popen又将我新写的文件删除,导致我的程序在后续出现bug。所以,如果没有可读性的要求,我建议优先使用system方法。

import os

obj = os.popen('ipconfig')
res = obj.read()
print(res)
listdir -- 获取指定文件夹中的所有文件

获取指定文件夹中的所有文件(包括文件和文件夹),返回文件的名称,以列表的形式返回,默认情况为当前路径。

import os

# 默认为当前路径
files = os.listdir()
print(files)

# 相对和绝对路径都可以使用
files = os.listdir('C:')
print(files)
walk -- 递归遍历目录

递归遍历指定目录,包括其所有的子目录,返回一个迭代器对象。迭代器每次返回一个元组,元组为三个元素:

  1. 第一个元素为字符串,表示当前目录路径;
  2. 第二个元素为列表,表示当前目录下的所有文件夹名(不包括子目录中的);
  3. 第三个元素为列表,表示当前遍历目录中的所有文件名(不包括子目录中的);
主要参数 含义
top 指定目录;
topdown 正序遍历还是倒序遍历,默认为True(正序);

请看下例,目录结构如下:

C:\USERS\MSR\DESKTOP\TEST
│root.txt
├─1
│  ├─1.txt
│  └─111
│     └─11.txt
└─2
   └─2.txt
import os

path = r'C:\Users\MSR\Desktop\test'

# 正序遍历
res = os.walk(path)  # 返回迭代器
for i in res:
    print(i)
r"""
('C:\\Users\\MSR\\Desktop\\test', ['1', '2'], ['root.txt'])
('C:\\Users\\MSR\\Desktop\\test\\1', ['111'], ['1.txt'])
('C:\\Users\\MSR\\Desktop\\test\\1\\111', [], ['11.txt'])
('C:\\Users\\MSR\\Desktop\\test\\2', [], ['2.txt'])
"""

# 倒序遍历(优先展示最深子目录)
res = os.walk(path, topdown=False)
for i in res:
    print(i)
r"""
('C:\\Users\\MSR\\Desktop\\test\\1\\111', [], ['11.txt'])
('C:\\Users\\MSR\\Desktop\\test\\1', ['111'], ['1.txt'])
('C:\\Users\\MSR\\Desktop\\test\\2', [], ['2.txt'])
('C:\\Users\\MSR\\Desktop\\test', ['1', '2'], ['root.txt'])
"""
getcwd -- 获取当前工作路径
import os

# 获取当前的工作路径
dir_path = os.getcwd()
print(dir_path)  # E:\0-project\python\test

# 获取当前文件的路径
file_path = __file__  # 使用内置属性__file__获取
print(file_path)  # E:/0-project/python/test/test3.py

注意:getcwd()获取的使用当前工作路径,__file__是获取当前文件的路径

对于这个注意事项,大家一定要铭记于心,因为我被人欺骗了,当然这应该算是pycharm的坑吧!

注意了,文件的所在路径和工作路径是不相同的,文件的所在路径就是在系统中的这个脚本文件实实在在的地址,如果这个文件在C:\下,那么在任何的情况下这个文件的所在路径都是C:\;而工作路径不同,如果我们在C:\下执行这个python文件,那么我们的工作路径就是C:\,如果我们是在D:\下执行,那么我们的工作路径就是D:\,这就是文件所在地址和工作地址的区别,但是在一般情况下,我们执行文件都是在文件的所在地址执行的,所以大部分的时候文件所在路径和当前工作路径都是相同的。

可我在最开始学习这个方法的时候,我的老师教我说getcwd()的作用是获取文件的所在路径,那么是什么让我一直以为getcwd()的作用是获取文件的所在路径呢?是老师教给我的……感觉这个老师很不靠谱?那么老师怎么没有发现其中的含义呢?我怎么又一直深信不疑呢?我觉得这个一定是要pycharm来背锅了!我们在学习的时候一般都是相信自己的实际操作的结果的,我们执行的结果是什么,反复那么几次,我们的印象就会加深!

然后今天2021年12月7日20:58:09我在给公司的项目写一个启动脚本,目的是为了避免使用繁琐的命令去启动关闭项目,那么我在写的时候为了能够在系统的任何一个地方都是可以使用这个脚本,所以将命令中的各种路径全部写为绝对路径,我们系统工程师对绝对路径是非常熟练的!但是在我写好使用的时候就发现程序根本就启动不起来,已启动就死掉了,我就开始找原因,后来我发现在程序的目录下启动就没有问题,在其它的地址启动就有问题,我就意识到这是路径的错误。当然我们是有日志的,我看日志说是配置文件相关的地方出现了错误,我一看,就很好奇,配置文件是在程序的目录中的,读取的时候使用相对路径来获取,但是却没有读到文件,但是我检查之后文件是存在的!那么这个问题就很明显了,工作路径出了问题。

但是我还疑惑,为什么会影响到相对路径吗?然后我就测试了getcwd,发现果然如此,getcwd返回的不是文件的所在地址而是当前所在的工作地址,这个时候我还不死心,因为当时老师说的不是这样,所以我以为是linux和windows的差异,所以我就咋爱windows中又测试了一遍,发现还是一样的。那么我就又疑惑了,怎么在pycharm中,工作路径始终都是文件的所在路径呢?然后我就发现原来pycharm中可以指定文件的工作路径,而且默认将当前的文件路径作为工作路径使用。

在这里插入图片描述

然后我看文档介绍:Return a unicode string representing the current working directory. ,emmm估计当时老师也是被pycharm坑了吧。所以大家以后如果想要在程序中固定工作路径,可以在启动文件中使用__file__获取,或者使用os.chdir方法。

然后最后还是在强调一下:工作路径会影响到相对路径的使用,但是不会影响到sys.pathpython的环境变量。

chdir -- 修改当前工作路径

之前我们有学过很多的函数,他们在涉及到路径的时候,一般默认情况都是当前脚本文件所在的目录(比如刚才的listdirgetcwd),如果将文件的默认工作路径修改,就会影响到其它的一些功能,比如说我们导入文件使用相对路径等,所以,谨慎使用。

import os

# 在修改默认工作路径前使用
print(os.getcwd())  # E:\0-project\python\test

# chdir 修改当前文件工作的默认路径
os.chdir('C:')

# 在修改工作路径后使用
print(os.getcwd())  # C:\
access -- 测试权限

用于测试一个指定路径或者文件的权限,返回True或者False。

语法:os.access(path, mode)

必要参数为path和mode,分别表示路径和测试的权限类型。

mode 说明
os.F_OK 是否存在;
os.R_OK 是否可读;
os.W_OK 是否可写;
os.X_OK 是否可执行;
urandom -- 随机字节对象

返回包含适合加密使用的随机字节的bytes对象。

import os

# 参数为字节长度
key = os.urandom(1)
print(key, len(key))
# b'\x92' 1

key = os.urandom(5)
print(key, len(key))
# b'\xde\x05/lh' 5
getpid&getppid -- 获取进程和父进程

getpid用于返回当前程序(脚本文件)的进程ID,getppid用于返回当前程序(脚本文件)的父进程ID。

# 获取进程唯一ID(PID)
import os

# getpid 返回当前进程的ID
print(os.getpid())  # 10784

# getppid 返回父进程的ID
# 如果父进程已退出,Windows计算机仍将运行返回其id;其他系统将返回“init”进程的id;
print(os.getppid())  # 16468
cpu_count -- 获取CPU核心数(逻辑)
import os

print(os.cpu_count())

"""
结果:
8
"""

常用属性

enciron -- 操作环境变量
import os

#  获取系统的所有环境变量
ev_var = os.environ
print(ev_var)

# 获取系统指定的环境变量
path_ev_var = os.environ['PATH']
print(path_ev_var)

# 添加环境变量
os.environ['PATH'] += r':/home/msr'  # Linux使用冒号分隔
os.environ['PATH'] += r';C:\Users\MSR'  # Windows使用分号分隔

# 其实可以看到,环境变量其实就是一个特殊的字典,修改环境变量就是在操作一个字典数据而已
name & sep & linesep
import os

# name 获取系统标识(Linux ->posix   windows -> nt)
print(os.name)  # nt

# sep 获取路径分隔符号
print(os.sep)  # \

# linesep 获取系统的换行符号
print(repr(os.linesep))  # '\r\n'

文件操作

mknod & remove -- 新建&删除文件

windows系统不支持此方法。

import os

os.mknod('test.txt')
os.remove('test.txt')
mkdir & rmdir -- 创建&删除文件夹
import os

os.mkdir('test_dir')
os.rmdir('test_dir')
rename -- 重命名文件或文件夹

语法:rename(old_path, new_path)

import os

os.rename('test.txt', 'hahaha.txt')
makedirs & removedirs -- 迭代创建&删除文件夹
import os

# 迭代创建文件夹
os.makedirs('a/b/c/d/e')

# 迭代删除文件夹(文件夹中存在文件,则该文件夹不删除)
os.removedirs('a/b/c/d/e')

路径模块

import os.path

路径模块也是系统模块中的一部分。

basename -- 返回路径中的文件名部分
import os.path

# 该路径不一定真实存在
file_path = r'..\学习笔记\day1笔记.py'
file_name = os.path.basename(file_path)
print(file_name)  # day1笔记.py
dirname -- 返回路径中目录部分
import os.path

file_path = r'..\学习笔记\day1笔记.py'
dir_path = os.path.dirname(file_path)
print(dir_path)  # ..\学习笔记
split -- 将目录和文件名拆分成两部分
import os.path

file_path = r'..\学习笔记\day1笔记.py'
tuple_var = os.path.split(file_path)
print(tuple_var)  # ('..\\学习笔记', 'day1笔记.py')
print(type(tuple_var))  # 返回元组: <class 'tuple'>
join -- 将多个路径组合在一起
import os.path

path1 = 'abc'
path2 = '123'
path3 = 'main.py'

# 使用join组合
path = os.path.join(path1, path2, path3)
print(path)  # abc\123\main.py

# 也可以使用 os.sep
path = path1 + os.sep + path2 + os.sep + path3
print(path)  # abc\123\main.py
splitext -- 将文件名分为文件名和后缀名
import os.path

# 分开文件名
file_name = 'main.py'
res = os.path.splitext(file_name)
print(res)  # ('main', '.py')
print(type(res))  # <class 'tuple'>

# 分来完整路径
file_path = r'..\学习笔记\day1笔记.py'
res = os.path.splitext(file_path)
print(res)  # ('..\\学习笔记\\day1笔记', '.py')
print(type(res))  # <class 'tuple'>

# 也可以使用字符串内置方法 split 实现
res = file_path.split('.')
print(res)  # ['', '', '\\学习笔记\\day1笔记', 'py']
print(type(res))  # <class 'list'>
getsize -- 获取指定文件的大小
import os.path

# 获取指定文件的大小(单位:byte)
file_size_byte = os.path.getsize('test.txt')
getctime -- 获取文件的创建时间

获取文件的创建时间,返回时间戳。(windows有明确的创建时间,linux只有最后一次的修改时间。)

import os.path
import time

# 获取文件创建时间
stamp_time = os.path.getctime('./test.py')
print(stamp_time)  # 1613989768.3445127

# 配合 时间模块使用 获取时间
print(time.ctime(stamp_time))  # Mon Feb 22 18:29:28 2021
getmtime -- 获取文件的最后一次修改时间
import os.path
import time

# 获取文件最后一次修改时间
stamp_time = os.path.getmtime('./test.py')
print(stamp_time)  # 1614037683.1067748

# 配合 时间模块使用 获取时间
print(time.ctime(stamp_time))  # Tue Feb 23 07:48:03 2021
getatime -- 获取文件最后一次访问时间
import os.path
import time

# 获取文件最后一次访问时间
stamp_time = os.path.getatime('./test.py')
print(stamp_time)  # 1635590737.799415

# 配合 时间模块使用 获取时间
print(time.ctime(stamp_time))  # Sat Oct 30 18:45:37 2021

不检查路径是否真实存在。

import os.path

# 检查路径类型,返回布尔值:
    # 不是对应类型或没有相应文件 : False
    # 是对应类型:True

# isdir 检查路径是否是文件夹
res = os.path.isdir('test.txt')

# isfile 检查路径是否是文件
res = os.path.isfile('test.txt')

# islink 检查路径是否是链接
res = os.path.islink('test.txt')
isabs -- 检查路径是否是绝对路径

不检查路径是否真实存在

import os.path

# 检查windows路径
path = r'E:\小黄片'
res = os.path.isabs(path)
print(res)  # True

# windows系统检查Linux路径
path = r'/root/home'
res = os.path.isabs(path)
print(res)  # True
abspath -- 相对路径转成绝对路径

先检查一个路径是否是相对路径,是则将其转成绝对路径,反之不变。

转成绝对路径的规则是:以当前的工作路径为基准,根据相对路径中的相对级别,将对应级别的工作路径替换为原路径中的相对路径。

不检查路径是否真实存在。

import os.path

# 绝对路径不改变
path = r'E:\学习资料'
new_path = os.path.abspath(path)
print(new_path)  # E:\学习资料

# 相对路径转成绝对路径
path = r'..\学习资料'
new_path = os.path.abspath(path)
print(new_path)  # E:\0-project\python\学习资料

# 根据级别自动转换
path = r'..\..\学习资料'
new_path = os.path.abspath(path)
print(new_path)  # E:\0-project\学习资料

# 如果相对的级别过多,就以根目录为准(不会报错)
path = r'..\..\..\..\..\..\..\..\..\..\学习资料'
new_path = os.path.abspath(path)
print(new_path)  # E:\学习资料
exists -- 检查路径是否真实存在

检查路径是否真实存在,返回布尔值。

import os.path

# 检查指定路径是否存在
path = r'E:\小黄片'
res = os.path.exists(path)
print(res)  # False

文件复制移动模块(文件操作)

import shutil

用于对文件进行操作。

获取文件信息,获取文件信息,见系统模块。

copyfileobj -- 复制文件(内容)

只复制文件的内容,通过文件IO操作,将一个文件的对象复制到另一个文件对象当中,因为需要在文件IO对象中操作,所以不推荐使用。

语法:copyfileobj(fsrc, fdst, length=16*1024)

copyfileobj(被复制文件对象,新文件对象,一次性读取字符数量。)

import shutil

with open('test.txt', 'r', encoding='UTF-8') as fp1 :
   with open('test2.txt', 'w', encoding='UTF-8') as fp2 :
      shutil.copyfileobj(fp1, fp2)
copyfile -- 复制文件(内容)

底层调用copyfileobj,使用方便快捷,所以推荐使用。

语法:copyfile(被复制文件路径, 新文件路径)

import shutil

shutil.copyfile('test.txt', 'test2.txt')
copymode -- 复制文件(权限)

仅复制文件的权限,不复制文件的内容(被赋值权限的文件必须存在),语法和copyfile相同。

import shutil

shutil.copymode('test.txt', 'test.txt')
copystat -- 复制文件(除了内容)

复制文件的所有的状态信息,包括各种日期、权限……就是没有内容。

import shutil

shutil.copystat('test.txt', 'test.txt')
copy & copy2 -- 复制文件
import shutil

# 复制文件内容和权限
shutil.copy('test.txt', 'test.txt')

# 完整复制整个文件(包括状态、权限、内容……)
shutil.copy2('test.txt', 'test.txt')
copytree -- 迭代复制文件夹中的所有
import shutil

shutil.copytree('../学习笔记', '../学习笔记备份')
rmtree -- 迭代删除文件夹(即使文件夹中有文件)
import shutil

shutil.rmtree('..\小黄片')
move -- 移动文件或文件夹
import shutil

shutil.move('D:\学习资料', 'C:\我的心血')

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python常用标准库(os系统模块、shutil文件操作模块) - Python技术站

(0)
上一篇 2023年4月2日
下一篇 2023年4月2日

相关文章

  • python常用标准库(时间模块time和datetime)

    常用的标准库 time时间模块 import time time — 获取本地时间戳 时间戳又被称之为是Unix时间戳,原本是在Unix系统中的计时工具。 它的含义是从1970年1月1日(UTC/GMT的午夜)开始所经过的秒数,不考虑闰秒。UNIX时间戳的 0 按照ISO 8601规范为 :1970-01-01T00:00:00Z。 比如: 时间戳 60 …

    Python开发 2023年4月2日
    00
  • python常用标准库(压缩包模块zipfile和tarfile)

    常用的标准库 在我们常用的系统windows和Linux系统中有很多支持的压缩包格式,包括但不限于以下种类:rar、zip、tar,以下的标准库的作用就是用于压缩解压缩其中一些格式的压缩包。 zip格式 import zipfile zipfile模块操作压缩包使用ZipFile类进行操作,使用方法和open的使用方法很相似,也是使用r、w、x、a四种操作模…

    Python开发 2023年4月2日
    00
  • Python常用标准库(pickle序列化和JSON序列化)

    常用的标准库 序列化模块 import pickle 序列化和反序列化 把不能直接存储的数据变得可存储,这个过程叫做序列化。把文件中的数据拿出来,回复称原来的数据类型,这个过程叫做反序列化。 在文件中存储的数据只能是字符串,或者是字节流,不能是其它的数据类型,但是如果想要将其存储就需要序列化。 Python中的序列化模块叫做 pickle,PHP等其它的一些…

    Python开发 2023年4月2日
    00
  • python常用标准库(math数学模块和random随机模块)

    常用的标准库 数学模块 import math ceil — 上取整 对一个数向上取整(进一法),取相邻最近的两个整数的最大值。 import math res = math.ceil(4.1) print(res) # 5 floor — 下取整 对一个数向下取整(退一法),取相邻最近的两个整数的最小值。 import math res = math.…

    Python开发 2023年4月2日
    00
  • Python 函数进阶-高阶函数

    高阶函数 什么是高阶函数 高阶函数就是能够把函数当成参数传递的函数就是高阶函数,换句话说如果一个函数的参数是函数,那么这个函数就是一个高阶函数。 高阶函数可以是你使用def关键字自定义的函数,也有Python系统自带的内置高阶函数。 自定义一个高阶函数 我们下面的例子中,函数 senior 的参数中有一个是函数,那么senior就是一个高阶函数;函数 ten…

    Python开发 2023年4月2日
    00
  • Python 函数进阶-递归函数

    递归函数 什么是递归函数 如果一个函数,可以自己调用自己,那么这个函数就是一个递归函数。 递归,递就是去,归就是回,递归就是一去一回的过程。 递归函数的条件 一般来说,递归需要边界条件,整个递归的结构中要有递归前进段和递归返回段。当边界条件不满足,递归前进,反之递归返回。就是说递归函数一定需要有边界条件来控制递归函数的前进和返回。 定义一个简单的递归函数 #…

    Python开发 2023年4月2日
    00
  • Python 函数进阶-lambda匿名函数和三元运算符

    匿名函数 什么是匿名函数 用一句话表达只有返回值的函数就是匿名函数。 匿名函数只用来实现一些简单的函数功能,所以追求代码的简洁和高效。 使用关键字 lambda 定义,所以匿名函数又称之为lambda表达式。 分类 无参数的 lambda 表达式 # 普通函数 def func(): return ‘hello motherland’ # 调用 res = …

    Python开发 2023年4月2日
    00
  • python生成器

    生成器 我们学习完推导式之后发现,推导式就是在容器中使用一个for循环而已,为什么没有元组推导式? 原因就是“元组推导式”的名字不是这样的,而是叫做生成器表达式。 什么是生成器 生成器表达式本质上就是一个迭代器,是定义迭代器的一种方式,是允许自定义逻辑的迭代器。生成器使用generator表示。 迭代器和生成器的区别 迭代器本身是系统内置的, 无法重写内置的…

    Python开发 2023年4月2日
    00
合作推广
合作推广
分享本页
返回顶部