Python能够方便地操作各种文件类型,其中之一就是Excel文件。本文将详细讲解如何使用Python批量操作Excel文件。
Step 1:准备工作
在进行Excel文件的批量操作之前,需要先安装Python的数据处理库pandas以及操作Excel的库openpyxl。你可以使用pip install pandas和pip install openpyxl命令进行安装。
Step 2:打开Excel文件
使用openpyxl.load_workbook()函数可以打开一个Excel文件,例如以下代码可以打开名为data.xlsx的Excel文件:
from openpyxl import load_workbook
wb = load_workbook("data.xlsx")
Step 3:切换工作表
使用wb["Sheet1"]可以获取名为Sheet1的工作表,同时可以通过.active来切换当前的工作表,如以下示例所示:
from openpyxl import load_workbook
wb = load_workbook("data.xlsx")
ws1 = wb["Sheet1"] # 通过工作表名获取工作表
ws2 = wb.active # 获取当前活跃的工作表
Step 4:读取Excel文件中的数据
使用pandas.read_excel()函数可以读取Excel文件中的数据,并以DataFrame形式返回。例如以下代码可以读取名为data.xlsx的Excel文件:
import pandas as pd
df = pd.read_excel("data.xlsx")
此外,pandas还支持读取指定的工作表、指定的行或列等操作。
Step 5:修改Excel文件中的数据
使用openpyxl库可以方便地修改Excel文件中的数据。例如以下代码可以将A1单元格的数据修改为123:
from openpyxl import load_workbook
wb = load_workbook("data.xlsx")
ws = wb.active
ws["A1"] = 123
wb.save("data.xlsx")
Step 6:保存Excel文件
使用wb.save()函数可以保存Excel文件。例如以上示例代码可以保存名为data.xlsx的Excel文件。
综上所述,以上便是Python批量操作Excel文件的详细攻略。以下是两个示例:
示例1:将多个Excel文件合并为一个
import pandas as pd
import os
# 获取输入文件夹中所有Excel文件的文件名
input_path = "input_folder/"
files = os.listdir(input_path)
excel_files = [input_path + f for f in files if f.endswith(".xlsx")]
# 将所有Excel文件逐个读取,并添加到一个列表中
df_list = []
for file in excel_files:
df_list.append(pd.read_excel(file))
# 将所有DataFrame合并为一个DataFrame,并保存为Excel文件
df = pd.concat(df_list, ignore_index=True)
df.to_excel("output.xlsx", index=False)
示例2:将Excel文件转换为CSV格式
import pandas as pd
# 读取Excel文件
df = pd.read_excel("data.xlsx")
# 将DataFrame保存为CSV文件
df.to_csv("data.csv", index=False)
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python批量操作Excel文件详解 - Python技术站