下面我就为您讲解如何使用Python获取Excel数据。
第一步:安装相关库
在使用Python获取Excel数据之前,我们需要安装相关的库。常用的库有:
- openpyxl:用于读写Excel文件;
- pandas:用于数据处理。
在安装之前,我们需要先打开cmd或者Anaconda Prompt,然后运行以下代码安装这两个库:
pip install openpyxl pandas
第二步:读取Excel文件
读取Excel文件需要使用openpyxl库。我们要先导入该库,然后使用load_workbook()方法打开Excel文件,然后选择要读取的sheet。
下面是一个简单的示例:
import openpyxl
# 打开Excel文件
wb = openpyxl.load_workbook('example.xlsx')
# 选择sheet
sheet = wb['Sheet1']
# 读取数据
for row in sheet.iter_rows(min_row=2):
name = row[0].value
age = row[1].value
print(name, age)
这个示例会打开名为“example.xlsx”的Excel文件,并读取名为“Sheet1”的sheet中的数据。
注意:示例中使用了iter_rows()方法来遍历sheet的每一行。其中,min_row参数指定了从哪一行开始读取,这里设置为2,即从第2行开始读取数据。
第三步:使用pandas处理数据
如果我们需要对数据进行一些处理,比如过滤掉一些列或者根据条件选取数据等,使用pandas库可以更加方便。以下是一个简单的示例:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
# 过滤数据
df_filtered = df.loc[df['Age'] >= 20]
# 输出结果
print(df_filtered)
在这个示例中,我们使用了pandas的read_excel()方法来读取Excel文件,然后使用loc()方法过滤出年龄大于等于20岁的数据。最后,输出过滤后的结果。
示例说明
在第二步中,我们使用了iter_rows()方法遍历每一行数据,并输出姓名和年龄。如果我们将代码中的print语句修改为以下代码:
print(f"姓名:{name},年龄:{age}")
则输出的结果会更加友好,例如:
姓名:张三,年龄:18
姓名:李四,年龄:21
姓名:王五,年龄:25
在第三步中,我们使用了pandas过滤数据。如果我们修改代码,将过滤条件改为年龄小于20岁,即:
df_filtered = df.loc[df['Age'] < 20]
则输出的结果如下:
Name Age
0 张三 18
这个示例中,只输出了18岁以下的数据。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:浅谈Python如何获取excel数据 - Python技术站