Python读取pdf表格写入excel的方法

yizhihongxing

下面是Python读取pdf表格写入excel的方法的完整实例教程。

1. 环境准备

首先,我们需要安装三个Python库,分别是pdfplumberopenpyxlos,可以通过pip命令安装:

!pip install pdfplumber
!pip install openpyxl

2. 实现步骤

接下来,我们具体来看如何使用Python实现读取pdf表格写入excel的功能。

2.1 读取pdf表格

我们可以使用pdfplumber库来读取pdf表格,它提供了比较方便的接口。

import pdfplumber

# 读取pdf文件
pdf = pdfplumber.open("data.pdf")

# 获取第一页的数据
first_page = pdf.pages[0]

# 获取第一页中的表格数据
table = first_page.extract_tables()[0]

# 打印表格数据
print(table)

在上面的代码中,我们首先使用pdfplumberopen方法打开pdf文件,并获取到第一页的数据。然后,我们使用extract_tables方法从第一页中提取表格数据,并选择第一个表格进行打印。

2.2 写入excel表格

接下来,我们将获取到的pdf表格数据写入到excel文件中,可以使用openpyxl库来实现。

import openpyxl

# 创建一个新的excel文件
workbook = openpyxl.Workbook()

# 获取第一个sheet
sheet = workbook.active

# 将表格数据写入excel中
for row in table:
    sheet.append(row)

# 保存excel文件
workbook.save("data.xlsx")

在上面的代码中,我们首先使用openpyxlWorkbook来创建一个新的excel文件,并获取到第一个sheet。然后,我们使用sheet的append方法将获取到的表格数据写入excel中。最后,我们使用save方法保存excel文件。

3. 完整实例

下面是一个完整的例子,将pdf中的第一个表格数据读取并写入excel文件。

import pdfplumber
import openpyxl

# 读取pdf文件
pdf = pdfplumber.open("data.pdf")

# 获取第一页的数据
first_page = pdf.pages[0]

# 获取第一页中的表格数据
table = first_page.extract_tables()[0]

# 创建一个新的excel文件
workbook = openpyxl.Workbook()

# 获取第一个sheet
sheet = workbook.active

# 将表格数据写入excel中
for row in table:
    sheet.append(row)

# 保存excel文件
workbook.save("data.xlsx")

4. 示例说明

示例1:读取pdf中的表格数据

假设我们有一个名为data.pdf的pdf文件,其中包含了一个表格数据,我们可以使用以下代码来读取表格数据:

import pdfplumber

# 读取pdf文件
pdf = pdfplumber.open("data.pdf")

# 获取第一页的数据
first_page = pdf.pages[0]

# 获取第一页中的表格数据
table = first_page.extract_tables()[0]

# 打印表格数据
print(table)

在上面的代码中,我们使用pdfplumber库来读取pdf文件,并获取到第一页中的表格数据。然后,我们使用print方法来打印表格数据。

示例2:将表格数据写入excel文件

使用示例1中获取到的表格数据,我们可以将其写入excel文件中,代码如下:

import openpyxl

# 创建一个新的excel文件
workbook = openpyxl.Workbook()

# 获取第一个sheet
sheet = workbook.active

# 将表格数据写入excel中
for row in table:
    sheet.append(row)

# 保存excel文件
workbook.save("data.xlsx")

在上面的代码中,我们使用openpyxl库来创建一个新的excel文件,并将表格数据写入excel中。最后,我们使用save方法来保存excel文件。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python读取pdf表格写入excel的方法 - Python技术站

(1)
上一篇 2023年5月13日
下一篇 2023年5月13日

相关文章

  • python使用tkinter库实现五子棋游戏

    当然,我很乐意为您提供“python使用tkinter库实现五子棋游戏”的完整攻略。以下是详细的步骤和示例: 步骤 导入Tkinter库 python import tkinter as tk 创建游戏窗口 python window = tk.Tk() window.title(“五子棋游戏”) window.geometry(“500×500”) 绘制游…

    python 2023年5月13日
    00
  • IronPython连接MySQL的方法步骤

    以下是”IronPython连接MySQL的方法步骤”的详细讲解。 环境准备 在开始之前,您需要事先准备以下环境: 安装 IronPython 运行环境,IronPython 支持 .NET Framework 4.0 或更高版本。 安装 MySQL 数据库,并创建测试表(例如 employee)和数据(例如 id=1, name=’Alice’)。 步骤 …

    python 2023年5月31日
    00
  • 这个python代码线程安全吗(扭曲的线程)?

    【问题标题】:Is this python code thread safe (thread with twisted)?这个python代码线程安全吗(扭曲的线程)? 【发布时间】:2023-04-05 00:21:02 【问题描述】: 我正在编写一个应用程序来收集 UDP 消息并每 1 秒处理一次。 应用原型如下: from twisted.intern…

    Python开发 2023年4月6日
    00
  • python 列表套json字典根据相同的key筛选数据

    当Python列表中嵌套着多个JSON字典,我们要从中筛选出与某个key相同的数据时,可以通过以下步骤操作: 使用json库中的loads()函数将JSON字符串转换为Python字典 遍历Python列表,逐个字典查找目标key并匹配 如果匹配成功,则保存该字典到一个新的列表 下面,我们将通过两个示例详细讲述这个过程。 示例一 假设我们有如下一个Pytho…

    python 2023年6月3日
    00
  • python实现聚类算法原理

    下面是关于“Python实现聚类算法原理”的完整攻略。 1. 聚类算法简介 聚类算法是一种无监督学习算法,它的目标是将数据中的样本分成若干个类别,使得同一类别内的样本相似度高,不同类别之间的相似度低。聚类算法的核心是距离度量和聚类中心。距离度量用于计算样本之间的相似度,聚类心用于表示每个类别的中心点。 2. K-Means算法 K-Means算法是一种基于距…

    python 2023年5月13日
    00
  • Python调用服务接口的实例

    下面是关于“Python调用服务接口的实例”的完整攻略: 什么是服务接口 服务接口是计算机系统中不同软件之间互相交流的一种方式。在通信协议上,服务接口定义了通信的方式和规则。 在Web应用中,经常会使用服务接口来提供数据给前端,如RESTful API。而服务接口的调用也是Web开发过程中重要的一部分。 Python提供了很多第三方包来调用服务接口,比如re…

    python 2023年6月3日
    00
  • 教你如何使用Python开发一个钉钉群应答机器人

    教你如何使用Python开发一个钉钉群应答机器人 简介 本攻略将会教你如何使用 Python 来开发一个简单的钉钉群应答机器人,使其能够自动应答群中的消息。 环境要求 Python 3.6 或以上版本 钉钉开放平台账号 准备工作 首先需要在钉钉开放平台上创建一个自定义机器人,获取到钉钉开发者账号中的 access_token。 安装 dingtalkchat…

    python 2023年5月23日
    00
  • 解决Jupyter notebook更换主题工具栏被隐藏及添加目录生成插件问题

    以下是详细讲解“解决Jupyter notebook更换主题工具栏被隐藏及添加目录生成插件问题”的完整攻略: 1. 解决Jupyter notebook更换主题工具栏被隐藏问题 步骤1:安装 jupyterthemes 库 在命令行中输入以下命令进行安装: pip install jupyterthemes 步骤2:选择主题 在命令行中输入以下命令来列出可选…

    python 2023年5月20日
    00
合作推广
合作推广
分享本页
返回顶部