下面是使用Python合并多个格式一致的Excel文件的完整实例教程。
环境准备
在进行本例子之前,请确保已经安装 Python 和 Pandas 库。
步骤一:导入必要的库
在此之前,你需要了解 Pandas 模块。 Pandas 是一个数据分析的 Python 库, 它可以用来清洗、处理和分析数据。
import pandas as pd
import os
在此导入两个库,一个是 Pandas。 另一个是操作系统库 os,用于跨平台地读取和写入文件。
步骤二:列出所有 Excel 文件
files = os.listdir()
excel_files = [i for i in files if i.endswith('.xlsx')]
列出存储合并数据的文件夹中所有的 Excel 文件,并筛选出带有 .xlsx 扩展名的文件名。
步骤三:将所有数据读入 Pandas
df = pd.concat([pd.read_excel(i) for i in excel_files], ignore_index=True)
使用 Pandas 的 read_excel() 函数将所列文件中的所有数据读取到一个 Pandas 数据帧(DataFrame)中。然后使用 Pandas 的 concat() 函数将 DataFrames 组合为一个 DataFrame。
步骤四:将 DataFrame 写入一个新的 Excel 文件
df.to_excel('merged.xlsx', index=False)
使用 Pandas 的 to_excel() 函数将 DataFrame 中所有数据写入一个新的 Excel 文件。将 index 参数设置为 False 目的是不让 Pandas 将 DataFrame 中的行索引写入 Excel 文件中。如果不设置,Excel 文件中将会有一个额外的空列,其中包含行索引。
完成啦,现在你可以在当前目录下找到一个名为 merged.xlsx 的文件,其中包含了所有 Excel 文件中的数据。
示例一:合并文件中的数据
假设我们有两个 Excel 文件:data1.xlsx 和 data2.xlsx, 每个文件都包含下面三列数据:name, age, city。
在执行示例之前,请将要合并的两个文件放在一个文件夹中。
import pandas as pd
import os
files = os.listdir('excel_files')
excel_files = [i for i in files if i.endswith('.xlsx')]
df = pd.concat([pd.read_excel(os.path.join('excel_files', i)) for i in excel_files], ignore_index=True)
df.to_excel('merged_data.xlsx', index=False)
执行以上代码后,数据将被读取,合并并保存到名为 merged_data.xlsx 的新文件中。
示例二:合并多个工作表
在此示例中,我们将读取名为 mydata.xlsx 的 Excel 文件,该文件包含四个工作表,每个工作表都具有相同的结构。 我们将从所有工作表中读取数据,并将其合并到一个单独的 DataFrame 中。
import pandas as pd
df = pd.concat(pd.read_excel('mydata.xlsx', sheet_name=None), ignore_index=True)
df.to_excel('merged_sheets.xlsx', index=False)
执行以上代码后,所有工作表中的数据将被读取,合并并保存到名为 merged_sheets.xlsx 的新文件中。
希望这个实例能够帮助你理解如何使用 Python 合并多个格式一致的 Excel 文件。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:使用 Python 合并多个格式一致的 Excel 文件(推荐) - Python技术站