Python读取Excel实例详解
简介
Excel是广泛使用的电子表格软件,它的表格内容以.xlsx结尾的文件格式保存。Python是一门强大的编程语言,可以用于数据处理、数据可视化、机器学习等领域。在Python中,我们可以使用多种方式读取Excel文件,本文将提供一些实例进行讲解。
安装第三方库
在使用Python进行Excel读取之前,我们需要安装一些第三方库(即Python Package Index,简称pip)。
在命令行中输入以下命令来安装需要的库:
pip install pandas
pip install openpyxl
pandas库使用起来较为简单,但是 如果要根据某种条件过滤数据、计算平均值、极值之类的复杂操作,需要学习更多、更复杂的知识,而openpyxl则更加灵活、自由,但是需要使用更多的代码来完成操作。
pandas读取Excel
pandas库提供了read_excel()
方法可以简单地读取Excel文件,读取后的数据可以转换为DataFrame类型,可以进行数据筛选、聚合等操作。以下是一个简单的示例:
import pandas as pd
df = pd.read_excel('example.xlsx')
print(df.head())
其中,read_excel()
是读取Excel文件的方法,'example.xlsx' 是要读取的文件名。head()
方法是pandas库提供的DataFame的方法,用于查看前五行数据,相当于SQL中的SELECT * FROM table LIMIT 5;
。
openpyxl读取Excel
openpyxl库是Python操作Excel文件的第三方库,它提供了更多的灵活性。对于那些需要对Excel表格进行精细化操作的情况下,openpyxl是更好的选择。下面是一个简单的openpyxl库示例:
import openpyxl
workbook = openpyxl.load_workbook('example.xlsx')
sheet = workbook.active
for row in sheet.iter_rows(min_row=2, max_col=3, values_only=True):
if row[1] == ‘worker1’:
print(row)
其中,load_workbook()
方法是加载Excel工作薄(workbook)的方法,‘example.xlsx’是要读取的文件名。.active
方法是获取当前活动的工作表(worksheet)。
因为在Excel表格中第一行通常是表头,不属于数据范畴,因此iter_rows()
方法读取数据,从第二行开始,到第三列结束。values_only=True
表示只读取数据的值,而不是格式等其他信息。for
循环遍历每一行数据,找到Worker1的信息并打印。
总结
本文介绍了两种Python读取Excel文件的方法。如果只需要对数据进行筛选、聚合等操作,可以使用pandas库进行操作。如果需要对数据进行更复杂的处理,可以选择openpyxl库。
以上示例仅供参考,实际情况下,读取Excel数据还需要根据具体情况进行特定的处理,开发者需要根据具体情况进行调整。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python读取Excel实例详解 - Python技术站