利用python对Excel中的特定数据提取并写入新表的方法

这里为你详细讲解用 Python 提取 Excel 表格中特定数据并写入新表格的方法:

1. 准备工作

首先,我们需要安装 pandasopenpyxl 这两个库来帮助我们操作 Excel 表格。你可以打开命令行输入以下命令安装这两个库:

pip install pandas openpyxl

然后我们需要有一个 Excel 文件作为我们的操作对象。在本例中,我们假设我们有一个名为 test.xlsx 的 Excel 文件,需要从中提取数据。

2. 数据提取

接下来,我们需要根据 Excel 表格的具体格式,使用 pandas 去读取其中的数据。假设我们需要提取表格中命名为 'Sheet1' 的工作表中第二列(B 列)中小于等于 10 的数据。你可以用以下代码实现:

import pandas as pd

# 读取 Excel 文件
data = pd.read_excel('test.xlsx', sheet_name='Sheet1')

# 选择第二列中小于等于 10 的数据并打印
result = data[data['B'] <= 10]
print(result)

在这个例子中,我们使用了 pd.read_excel() 方法读取 Excel 表格中 Sheet1 工作表的数据,并将其存储在 data 中。然后我们使用条件筛选语句 data['B'] <= 10 选择了第二列中小于等于 10 的数据,将其存储在 result 中,并使用 print() 函数输出结果。

3. 数据写入

接下来,我们需要将筛选到的数据写入一个新的 Excel 文件中。我们可以使用 openpyxl 中的 WorkbookWorksheet 类来新建一个 Excel 文件,并使用 pandas 中的 to_excel() 方法将数据写入新表格。你可以用以下代码实现:

from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

# 创建新 Excel 文件
wb = Workbook()
ws = wb.active

# 将数据写入工作表
for row in dataframe_to_rows(result, index=False, header=True):
    ws.append(row)

# 保存修改后的 Excel 文件
wb.save('output.xlsx')

在这个例子中,我们新建了一个 Workbook 对象,将其激活,然后使用 dataframe_to_rows() 方法将 Pandas 数据框对象 result 转换为行列表,并将其添加到新工作表 ws 中。最后使用 wb.save() 方法将修改后的 Excel 文件保存到本地,命名为 output.xlsx

4. 示例说明

假设我们有一个名为 test.xlsx 的 Excel 文件,其中 Sheet1 工作表的数据如下:

A B
Cat 7
Dog 15
Bird 3
Fish 9

我们使用上面提到的方法,筛选出 Sheet1 中第二列中小于等于 10 的数据,得到以下结果:

A B
Cat 7
Bird 3
Fish 9

最后我们使用 to_excel() 方法将结果写入到新的 Excel 文件 output.xlsx 中。

另外一个示例,假设我们需要提取 Excel 文件中多个工作表中命名为 'Total' 的表格中所有数值大于 100 的数据,并将其写入到新的 Excel 文件中。你可以用以下代码实现:

import pandas as pd
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows

# 读取 Excel 文件,并提取所有工作表中命名为 'Total' 的工作表的数据
data = pd.read_excel('test.xlsx', sheet_name='Total', header=None)

# 使用条件筛选,选择大于 100 的数值
result = data[data > 100].dropna(how='all').dropna(how='all', axis=1)

# 创建新 Excel 文件,并将筛选后的数据写入工作表
wb = Workbook()
ws = wb.active

for row in dataframe_to_rows(result, index=False, header=False):
    ws.append(row)

# 保存修改后的 Excel 文件
wb.save('output.xlsx')

在这个例子中,我们使用了 pd.read_excel() 方法读取 Excel 表格中所有工作表中命名为 'Total' 的工作表的数据,并将其存储在 data 中。然后我们使用条件筛选语句选择大于 100 的数值,将其存储在 result 中,并使用了 dropna() 方法将数据框中的所有 NaN 值删除。最后我们使用 to_excel() 方法将结果写入到新的 Excel 文件 output.xlsx 中。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:利用python对Excel中的特定数据提取并写入新表的方法 - Python技术站

(2)
上一篇 2023年5月13日
下一篇 2023年5月13日

相关文章

  • Python多线程与同步机制浅析

    Python多线程与同步机制浅析 在Python中,多线程是一种非常常见的并发编程方式。多线程可以提高程序的执行效率,但同时也会带来一些问题,如线程安全、死锁等。为了解决这些问题,我们需要使用同步机制来保证线程之间的协调和安全。 多线程 多线程是在一个程序中同时运行多个线程,每个线程都可以独立执行不同的任务。多线程可以提高程序的执行效率,特别是在处理I/O密…

    python 2023年5月14日
    00
  • 利用numpy和pandas处理csv文件中的时间方法

    处理CSV文件中的时间方法,涉及到两个关键库:NumPy和Pandas。在CSV文件中,时间通常表示为字符串数据,我们需要使用Python中的这些库将其转换为机器可读的日期和时间格式。 以下是一个基本的步骤: 步骤 1:导入必要的库 import numpy as np import pandas as pd 步骤 2:读取CSV文件 df = pd.rea…

    python 2023年6月2日
    00
  • Python简明入门教程

    《Python简明入门教程》是一篇针对初学者的Python入门教程,主要介绍了Python的基本语法、数据类型、函数、模块等内容。下面是一个详细的攻略。 Part 1:安装Python环境和编辑器 首先需要在Python官网下载并安装Python的最新版本。 推荐使用VSCode、PyCharm等编辑器来编写Python代码,这些编辑器都支持Python的语…

    python 2023年5月13日
    00
  • 详解Python中的时间格式的读取与转换(time模块)

    详解Python中的时间格式的读取与转换(time模块) 时间的处理在编程中非常常见,而Python中的time模块提供了很多处理时间的函数和方法。本文将详细讲解Python中的时间格式的读取与转换,包括时间戳、格式化时间字符串与时间元组之间的相互转换。 什么是时间戳? 时间戳是以浮点小数表示的秒数。它可以被用于任何需要一个唯一的表示日期和时间的应用程序中。…

    python 2023年6月2日
    00
  • python中的 zip函数详解及用法举例

    Python中的zip函数详解及用法举例 什么是Zip函数 zip()函数是Python中一个常见的内置函数,可以做到多个列表或其他的可遍历对象进行组合,最终返回一个迭代器对象,每个元素分别来自每个可遍历对象中的对应位置。 基本语法 zip函数的基本语法格式为: zip([iterable, …]) 其中参数iterable为多个迭代器或可遍历对象。 用…

    python 2023年5月14日
    00
  • 在Python中对点(x, y)进行二维多项式的评估

    在Python中进行二维多项式的评估需要使用到numpy库中的polyval()函数,而在使用该函数之前需要首先安装numpy库。可以使用如下的命令进行安装: pip install numpy 接下来就可以使用polyval()函数对多项式进行评估了。该函数的语法如下: numpy.polyval(p, x) 其中p是多项式系数向量,x是自变量向量。 下面…

    python-answer 2023年3月25日
    00
  • Python基本类型的连接组合和互相转换方式(13种)

    Python基本类型有13种,它们分别是:整数(int)、长整数(long)、浮点数(float)、复数(complex)、字符串(str)、列表(list)、元组(tuple)、集合(set)、字典(dict)、布尔型(bool)、空类型(NoneType)、字节类型(bytes)、字节数组类型(bytearray)。这些基本类型之间可以互相转换,并且可以…

    python 2023年5月14日
    00
  • Python SQLAlchemy入门教程(基本用法)

    下面我将分步骤详细讲解 Python SQLAlchemy 入门教程的完整攻略。 1. 前言 Python SQLAlchemy 是 Python中一款优秀的 ORM 框架,它可以将关系数据库中的表结构映射到 Python 对象上,并支持使用对象操作数据库。 2. 准备工作 在开始之前,我们需要准备一些工作: 安装必要的依赖,包括 SQLAlchemy 和 …

    python 2023年6月3日
    00
合作推广
合作推广
分享本页
返回顶部