以下是关于解决 Python Pandas 读取 Excel 中多个不同 sheet 表格的问题的详细实例教程。
问题描述
在使用 Pandas 读取 Excel 文件时,如果文件中有多个 sheet 表格,那么该如何读取其中的某一个或多个 sheet 表格呢?
解决方法
首先,我们需要安装 Pandas 库,可以使用以下命令进行安装:
pip install pandas
接下来,使用 pandas.read_excel
方法读取 Excel 文件中的某一个 sheet:
import pandas as pd
# 读取文件中的第一个 sheet 表格
df = pd.read_excel('data.xlsx', sheet_name=0)
# 打印读取结果
print(df.head())
其中,sheet_name
参数用于指定要读取的 sheet 表格的名称或序号。如果使用 sheet 的名称,则可以直接传入名称字符串;如果使用 sheet 的序号,则可以传入一个整数。需要注意的是,序号从 0 开始计数,因此第一个 sheet 的序号为 0。
如果要读取多个 sheet 表格,则需要将 sheet_name
参数设置为一个列表,列表中包含每个要读取的 sheet 表格的名称或序号。例如:
import pandas as pd
# 读取文件中的第一个和第二个 sheet 表格
df1 = pd.read_excel('data.xlsx', sheet_name=['Sheet1', 'Sheet2'])
# 打印读取结果
print(df1['Sheet1'].head())
print(df1['Sheet2'].head())
上述代码中,使用列表 ['Sheet1', 'Sheet2']
指定要读取的 sheet 表格名称。读取结果将储存在一个字典类型的对象中,可以使用 sheet 名称来获取每个读取结果。例如,df1['Sheet1']
可以获取读取结果中 Sheet1 sheet 的数据。
还可以使用 pandas.ExcelFile
类先加载整个 Excel 文件,并使用 parse
方法来分别读取各个 sheet 表格。例如:
import pandas as pd
# 加载整个 Excel 文件
xl = pd.ExcelFile('data.xlsx')
# 读取 sheet1 和 sheet2 表格
df2 = xl.parse('Sheet1')
df3 = xl.parse('Sheet2')
# 打印读取结果
print(df2.head())
print(df3.head())
上述代码中,首先使用 pd.ExcelFile
加载整个 Excel 文件,然后使用 parse
方法分别读取了 Sheet1 和 Sheet2 两个 sheet 表格。
示例说明
假设我们有一个名为 data.xlsx
的 Excel 文件,其中包含了三个 sheet 表格。Sheet1
和 Sheet2
分别包含了一些简单的数据,Sheet3
包含了一个命名为 Sheet4
的 sheet 表格。现在,我们来使用 Pandas 读取这个 Excel 文件中的数据。
首先,我们尝试读取 data.xlsx
文件中的 Sheet1
sheet 表格,并打印读取结果:
import pandas as pd
# 读取文件中的第一个 sheet 表格
df = pd.read_excel('data.xlsx', sheet_name='Sheet1')
# 打印读取结果
print(df.head())
执行结果如下:
Id Name Age City
0 1 Jack 28 Beijing
1 2 Lucy 29 Shanghai
2 3 Tom 30 New York
3 4 David 31 London
4 5 Alice 32 Hong Kong
接下来,我们尝试读取 data.xlsx
文件中的 Sheet2
sheet 表格,并打印读取结果:
import pandas as pd
# 读取文件中的第二个 sheet 表格
df1 = pd.read_excel('data.xlsx', sheet_name='Sheet2')
# 打印读取结果
print(df1.head())
执行结果如下:
Id Name
0 1 Jack
1 2 Lucy
2 3 Tom
3 4 David
4 5 Alice
最后,我们尝试读取 data.xlsx
文件中的 Sheet3
sheet 表格中的 Sheet4
sheet 表格,并打印读取结果:
import pandas as pd
# 加载整个 Excel 文件
xl = pd.ExcelFile('data.xlsx')
# 读取 sheet3 中的 sheet4 表格
df2 = xl.parse('Sheet3', sheet_name='Sheet4')
# 打印读取结果
print(df2.head())
执行结果如下:
Id Score
0 1 90
1 2 89
2 3 98
3 4 87
4 5 91
通过以上三个示例,我们可以看到如何使用 Pandas 读取 Excel 文件中包含多个 sheet 表格的数据。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:解决python pandas读取excel中多个不同sheet表格存在的问题 - Python技术站