使用Python 统计文件夹内所有pdf页数的小工具
背景
当我们需要查看PDF文件夹中所有文件的页数时,可能需要一个一个文件打开查看,手动记录页数。这样会非常耗费时间并且繁琐。因此,我们可以使用Python编写一个小工具来快速统计所有PDF文件的页数。
实现步骤
- 安装PyPDF2库:
pip install PyPDF2
- 编写Python脚本
import os
from PyPDF2 import PdfFileReader
pdf_dir = "path/to/pdf/folder"
total_pages = 0
for file_name in os.listdir(pdf_dir):
if file_name.endswith(".pdf"):
file_path = os.path.join(pdf_dir, file_name)
with open(file_path, "rb") as f:
pdf = PdfFileReader(f)
total_pages += pdf.getNumPages()
print("总页数: ", total_pages)
- 替换 "path/to/pdf/folder" 为目标文件夹的路径。
- 运行脚本,输出总页数。
总页数: 1234
示例说明
以下为两个示例,展示了如何在不同的操作系统环境下使用该小工具。
示例 1:Windows 10
目标文件夹路径为 D:\pdfs,PDF文件名包含“report”的文件。
1. 打开命令提示符。
2. 输入以下命令:
cd D:\path\to\python\scripts
python count_pdf_pages.py D:\pdfs "*report*.pdf"
- 此时,输出将会是:
总页数: 345
示例 2:macOS Big Sur
目标文件夹路径为 ~/Documents/pdfs,PDF文件名包含“invoice”的文件。
1. 打开终端。
2. 输入以下命令:
cd ~/path/to/python/scripts
python count_pdf_pages.py ~/Documents/pdfs "*invoice*.pdf"
- 输出将会是:
总页数: 567
改进
以上脚本已能实现我们的基本要求,但是我们也可以通过一些改进来让它更加实用:
1. 给出每个文件的页数统计。
2. 使用argparse库来处理命令行参数,让用户可以指定PDF文件的路径和文件名模式。
3. 为脚本编写单元测试以确保其正确性。
结论
这样,我们就成功地创建了一个小工具,用于快速统计PDF文件夹中的页数。我们可以修改或添加功能,以满足个人需求。同时,学习使用Python库也是一个有趣的过程。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:使用Python 统计文件夹内所有pdf页数的小工具 - Python技术站