如何在Python中使用Pandas从excel表中创建一个带有多个索引的数据透视表

2023年3月27日下午3:20 • python-answer

通过Pandas，我们可以很方便地从Excel表中读取数据并创建数据透视表。一个数据透视表可以是带有一个或多个索引的，也可以是带有多个计算值的表格，便于对大数据进行分析和可视化。下面是在Python中使用Pandas创建一个带有多个索引的数据透视表的步骤。

步骤一：导入Pandas库

首先要导入pandas库，具体代码如下：

import pandas as pd

步骤二：读取Excel文件

使用pandas库中的read_excel()方法读取Excel表格，具体代码如下：

df = pd.read_excel('数据.xlsx')

步骤三：创建透视表

使用pandas库中的pivot_table()方法创建透视表，具体代码如下：

pivot_table = pd.pivot_table(df,index=['地区','日期'],values=['销售额','利润'],aggfunc=[np.sum,np.mean])

其中：

index参数：指定用哪些列作为行索引，这里选择了“地区”和“日期”列；
values参数：指定用哪些列计算，这里选择了“销售额”和“利润”列；
aggfunc参数：指定计算函数，这里选择了求和（np.sum）和平均值（np.mean）。

以上代码生成了一个包含多个索引的数据透视表。这个表格将“地区”和“日期”作为行索引，将“销售额”和“利润”作为列，并在每个单元格中用求和和平均值计算每个组合的值。

接下来看一个完整的示例代码。

import pandas as pd
import numpy as np

df = pd.read_excel('数据.xlsx')

pivot_table = pd.pivot_table(df,index=['地区','日期'],values=['销售额','利润'],aggfunc=[np.sum,np.mean])

print(pivot_table)

注：示例数据xlsx文件下载链接：https://download.csdn.net/download/yyong1101/14390333

以上代码中的pivot_table输出结果会长这样：

		sum		mean
地区	日期	销售额	利润	销售额	利润
北京	2020/1/1	700000	250000	350000.0	125000.0
	2020/1/2	900000	300000	450000.0	150000.0
上海	2020/1/1	800000	200000	400000.0	100000.0
	2020/1/2	600000	150000	300000.0	75000.0