当我们需要对一个表格进行汇总统计时,可以使用Pandas库中的pivot函数来实现。pivot函数可以将表格中的行和列交换,数据也会随之相应变化,以实现特定的汇总要求。
使用Pandas库中的pivot函数,首先需要读取数据生成一个DataFrame数据框。然后,我们可以使用pivot函数来将DataFrame数据框进行重塑。
1. 语法格式
pivot函数的语法格式如下:
DataFrame.pivot(self, index=None, columns=None, values=None)
其中,参数说明如下:
- index:设置生成的DataFrame数据框的索引列,默认为None。
- columns:设置生成的DataFrame数据框的列名,默认为None。
- values:设置生成的DataFrame数据框的值列名,默认为None。
2. 示例
现在我们通过两个示例来详细讲解pivot函数的基础知识点。
示例1
我们首先生成一个DataFrame数据框,如下所示:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'age': [25, 30, 22, 40, 35],
'sex': ['F', 'M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
执行上述代码后,我们得到一个包含5个人员信息的DataFrame数据框,共有3个列(name,age,sex)。
现在,我们需要对该DataFrame数据框进行汇总统计,将性别列作为索引,年龄列作为列名,人员数量列作为值。我们可以使用pivot函数来实现,代码如下所示:
pivot_df = df.pivot(index='sex', columns='age', values='name')
上述代码中,我们指定了index参数为‘sex’,columns参数为‘age’,values参数为‘name’。执行该代码后,我们得到了一个重塑后的表格,其中性别列作为索引,年龄列作为列名,人员姓名列作为值。
示例2
我们再通过一个示例来深入理解pivot函数的基础知识点。假设我们有以下交易数据:
import pandas as pd
data = {'date': ['1/1/2020', '1/2/2020', '1/3/2020', '1/1/2020', '1/2/2020', '1/3/2020'],
'category': ['A', 'B', 'C', 'A', 'B', 'C'],
'value': [100, 200, 300, 150, 250, 350]}
df = pd.DataFrame(data)
上述代码中,我们生成了一个包含日期、品类、交易金额三列值的DataFrame数据框。
现在,我们需要对该DataFrame数据框进行汇总统计,生成一个以日期为行索引,品类为列名,交易金额为值的新表格。我们可以使用pivot函数来实现,代码如下所示:
pivot_df = df.pivot(index='date', columns='category', values='value')
上述代码中,我们指定了index参数为‘date’,columns参数为‘category’,values参数为‘value’。执行该代码后,我们得到了一个重塑后的表格,其中日期列作为索引,品类列作为列名,交易金额列作为值。
以上是pivot函数的基础知识点的详细讲解和示例说明。通过学习,我们可以灵活运用pivot函数来实现各种场景下的数据处理需求。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python中pivot()函数基础知识点 - Python技术站