下面是详细讲解“python轻松办公将100个Excel中符合条件的数据汇总到1个Excel里”的完整实例教程。
1. 准备工作
首先需要安装pandas、xlrd以及openpyxl这三个库,安装方法如下:
!pip install pandas
!pip install xlrd
!pip install openpyxl
接着,在编写代码前,我们需要了解几个数据分析中的概念:
- DataFrame:二维表格数据,一般来自于csv、Excel等文件格式。
- Series:一维数组。
- Index:行或列的索引。
2. 完整实例
2.1. 案例1:将多个Excel中某一列值相同的行汇总到一个Excel中
首先,我们需要有100个Excel文件,并且所有的Excel文件都放在同一个文件夹下,本例中这个文件夹的路径为"data"。
我们需要找到Excel中某一列的值相同的行,并将这些行汇总到同一个Excel文件中。
假设我们要将Excel中“性别”列为男的所有信息汇总到一个Excel文件中,可以按照如下的步骤操作:
import os
import pandas as pd
files = os.listdir("./data") # 将"data"文件夹下的所有文件名读取出来
result = pd.DataFrame() # 创建一个空的DataFrame
# 遍历所有的Excel文件,将所有符合 male 条件的行汇总到 result 中
for file in files:
if ".xlsx" in file:
df = pd.read_excel(f"./data/{file}")
result = result.append(df[df['性别'] == '男'])
# 将结果保存到 result.xlsx 文件中
result.to_excel("./result.xlsx", index=False)
这个例子中使用了pandas库和os库,先通过os.listdir()函数读取指定文件夹下的所有文件名,然后遍历这些文件,读取每一个Excel文件中符合条件的行,使用append()函数将这些行添加到result中,并将结果保存到result.xlsx文件中。
2.2. 案例2:将多个Excel文件的数据并列到同一个Excel文件中
首先,我们需要有100个Excel文件,并且所有的Excel文件都放在同一个文件夹下,本例中这个文件夹的路径为"data"。
我们需要将所有的Excel文件中的数据并列到一个文件中。
import os
import pandas as pd
files = os.listdir("./data") # 将"data"文件夹下的所有文件名读取出来
result = pd.DataFrame() # 创建一个空的DataFrame
# 遍历所有的Excel文件,将所有行汇总到 result 中
for file in files:
if ".xlsx" in file:
df = pd.read_excel(f"./data/{file}")
result = pd.concat([result, df])
# 将结果保存到 result.xlsx 文件中
result.to_excel("./result.xlsx", index=False)
这个例子中使用了pandas库和os库,先通过os.listdir()函数读取指定文件夹下的所有文件名,然后遍历这些文件,读取每一个Excel文件中的数据,使用concat()函数将这些数据并列在一起,并将结果保存到result.xlsx文件中。
3. 结语
本文通过两个实例讲解了如何使用Python将多个Excel中的数据汇总到一个Excel文件中。希望对读者有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python轻松办公将100个Excel中符合条件的数据汇总到1个Excel里 - Python技术站