使用 Python 合并多个格式一致的 Excel 文件(推荐)

下面是使用Python合并多个格式一致的Excel文件的完整实例教程。

环境准备

在进行本例子之前,请确保已经安装 Python 和 Pandas 库。

步骤一:导入必要的库

在此之前,你需要了解 Pandas 模块。 Pandas 是一个数据分析的 Python 库, 它可以用来清洗、处理和分析数据。

import pandas as pd
import os

在此导入两个库,一个是 Pandas。 另一个是操作系统库 os,用于跨平台地读取和写入文件。

步骤二:列出所有 Excel 文件

files = os.listdir()
excel_files = [i for i in files if i.endswith('.xlsx')]

列出存储合并数据的文件夹中所有的 Excel 文件,并筛选出带有 .xlsx 扩展名的文件名。

步骤三:将所有数据读入 Pandas

df = pd.concat([pd.read_excel(i) for i in excel_files], ignore_index=True)

使用 Pandas 的 read_excel() 函数将所列文件中的所有数据读取到一个 Pandas 数据帧(DataFrame)中。然后使用 Pandas 的 concat() 函数将 DataFrames 组合为一个 DataFrame。

步骤四:将 DataFrame 写入一个新的 Excel 文件

df.to_excel('merged.xlsx', index=False)

使用 Pandas 的 to_excel() 函数将 DataFrame 中所有数据写入一个新的 Excel 文件。将 index 参数设置为 False 目的是不让 Pandas 将 DataFrame 中的行索引写入 Excel 文件中。如果不设置,Excel 文件中将会有一个额外的空列,其中包含行索引。

完成啦,现在你可以在当前目录下找到一个名为 merged.xlsx 的文件,其中包含了所有 Excel 文件中的数据。

示例一:合并文件中的数据

假设我们有两个 Excel 文件:data1.xlsx 和 data2.xlsx, 每个文件都包含下面三列数据:name, age, city。

在执行示例之前,请将要合并的两个文件放在一个文件夹中。

import pandas as pd
import os

files = os.listdir('excel_files')
excel_files = [i for i in files if i.endswith('.xlsx')]

df = pd.concat([pd.read_excel(os.path.join('excel_files', i)) for i in excel_files], ignore_index=True)

df.to_excel('merged_data.xlsx', index=False)

执行以上代码后,数据将被读取,合并并保存到名为 merged_data.xlsx 的新文件中。

示例二:合并多个工作表

在此示例中,我们将读取名为 mydata.xlsx 的 Excel 文件,该文件包含四个工作表,每个工作表都具有相同的结构。 我们将从所有工作表中读取数据,并将其合并到一个单独的 DataFrame 中。

import pandas as pd

df = pd.concat(pd.read_excel('mydata.xlsx', sheet_name=None), ignore_index=True)

df.to_excel('merged_sheets.xlsx', index=False)

执行以上代码后,所有工作表中的数据将被读取,合并并保存到名为 merged_sheets.xlsx 的新文件中。

希望这个实例能够帮助你理解如何使用 Python 合并多个格式一致的 Excel 文件。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:使用 Python 合并多个格式一致的 Excel 文件(推荐) - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Python3并发写文件与Python对比

    Python是一门非常强大的编程语言,除了能够处理各种数据类型,还拥有强大的并发处理能力。在并发写文件方面,Python3提供了多种实现方式,同时可以与Python2进行比较。下面我将详细讲解“Python3并发写文件与Python对比”的完整攻略: 一、Python3并发写文件 1.1 使用多线程 Python3中的多线程是一种轻量级的并发处理方式,通过使…

    python 2023年5月19日
    00
  • python:只想在opencv中显示红色通道

    【问题标题】:python: want to display red channel only in opencvpython:只想在opencv中显示红色通道 【发布时间】:2023-04-05 01:08:01 【问题描述】: 我是图像处理的初学者。我在许多颜色空间中显示图像,下面的代码显示 3 通道 R G B 中的图像,但是图像以灰色布局显示。我需要…

    Python开发 2023年4月6日
    00
  • 详解Python 使用 selenium 进行自动化测试或者协助日常工作

    详解Python使用Selenium进行自动化测试或者协助日常工作 什么是Selenium Selenium 是一个用于浏览器自动化的工具。它支持多种浏览器,包括但不限于 Chrome、Firefox 和 Safari。它可以用于自动化测试,网站自动化,以及协助日常工作任务等。 如何安装和配置 Selenium 在使用 Selenium 之前,需要安装 Se…

    python 2023年5月19日
    00
  • python读取测试数据的多种方式

    Python读取测试数据可以用多种方式,下面给出几种示例: 从文件读取数据 使用open函数读取txt文件 可以使用Python内置的open函数读取txt格式的数据,如下所示: with open("test.txt", "r") as f: data = f.read() 上述代码使用了with语句自动关闭文件,用…

    python 2023年6月3日
    00
  • python读取hdfs并返回dataframe教程

    下面是详细讲解“Python读取HDFS并返回DataFrame教程”的完整攻略。 1. 确认Hadoop环境配置 在使用Python读取HDFS前,需要先确保Hadoop环境已正确配置,Hadoop有分布式的特性,所以要确保Python所在的机器能够与HDFS集群的各个节点进行正常通信。 2. 安装pyarrow库 pyarrow是一个能够读取和写入分布式…

    python 2023年6月3日
    00
  • python操作Excel神器openpyxl看这一篇就够了

    下面是关于如何使用openpyxl进行操作Excel的教程。 简介 openpyxl是一个用于读取和编写Excel 2010 xlsx/xlsm/xltx/xltm文件的Python库。它在Python中提供了一种简单,有效的方法来操作Excel文件,而无需使用Microsoft Excel软件。 安装 安装openpyxl库可以使用pip命令: pip i…

    python 2023年5月13日
    00
  • python excel使用xlutils类库实现追加写功能的方法

    下面是详细讲解“pythonexcel使用xlutils类库实现追加写功能的方法”的完整实例教程: 1. 简介 PythonExcel是一个用于操作Excel文件的Python库,而xlutils则是一个PythonExcel的辅助类库,可以扩展PythonExcel的功能。通过使用xlutils,我们可以实现Excel文件的追加写入功能,即向已有的Exce…

    python 2023年5月13日
    00
  • python将unicode和str互相转化的实现

    将 unicode 转换为 str: 在 Python 3.x 中,默认的字符串类型为 UTF-8 编码的 Unicode 字符串。我们可以通过 str() 函数将 Unicode 字符串转换为普通的字符串类型。示例代码如下: #定义Unicode字符串 unicode_str = ‘你好,世界!’ #转换为字符串类型 str_str = str(unico…

    python 2023年5月31日
    00
合作推广
合作推广
分享本页
返回顶部