通过Pandas,我们可以很方便地从Excel表中读取数据并创建数据透视表。一个数据透视表可以是带有一个或多个索引的,也可以是带有多个计算值的表格,便于对大数据进行分析和可视化。下面是在Python中使用Pandas创建一个带有多个索引的数据透视表的步骤。
步骤一:导入Pandas库
首先要导入pandas库,具体代码如下:
import pandas as pd
步骤二:读取Excel文件
使用pandas库中的read_excel()方法读取Excel表格,具体代码如下:
df = pd.read_excel('数据.xlsx')
步骤三:创建透视表
使用pandas库中的pivot_table()方法创建透视表,具体代码如下:
pivot_table = pd.pivot_table(df,index=['地区','日期'],values=['销售额','利润'],aggfunc=[np.sum,np.mean])
其中:
index
参数:指定用哪些列作为行索引,这里选择了“地区”和“日期”列;values
参数:指定用哪些列计算,这里选择了“销售额”和“利润”列;aggfunc
参数:指定计算函数,这里选择了求和(np.sum
)和平均值(np.mean
)。
以上代码生成了一个包含多个索引的数据透视表。这个表格将“地区”和“日期”作为行索引,将“销售额”和“利润”作为列,并在每个单元格中用求和和平均值计算每个组合的值。
接下来看一个完整的示例代码。
import pandas as pd
import numpy as np
df = pd.read_excel('数据.xlsx')
pivot_table = pd.pivot_table(df,index=['地区','日期'],values=['销售额','利润'],aggfunc=[np.sum,np.mean])
print(pivot_table)
注:示例数据xlsx文件下载链接:https://download.csdn.net/download/yyong1101/14390333
以上代码中的pivot_table输出结果会长这样:
sum | mean | ||||
---|---|---|---|---|---|
地区 | 日期 | 销售额 | 利润 | 销售额 | 利润 |
北京 | 2020/1/1 | 700000 | 250000 | 350000.0 | 125000.0 |
2020/1/2 | 900000 | 300000 | 450000.0 | 150000.0 | |
上海 | 2020/1/1 | 800000 | 200000 | 400000.0 | 100000.0 |
2020/1/2 | 600000 | 150000 | 300000.0 | 75000.0 |
输出的数据透视表是一个标准的Pandas DataFrame对象,可以方便地进行数据分析和可视化处理。
以上就是如何在Python中使用Pandas从Excel表中创建一个带有多个索引的数据透视表的完整攻略。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何在Python中使用Pandas从excel表中创建一个带有多个索引的数据透视表 - Python技术站