python中pivot()函数基础知识点

2023年5月25日下午5:36 • 人工智能概览

当我们需要对一个表格进行汇总统计时，可以使用Pandas库中的pivot函数来实现。pivot函数可以将表格中的行和列交换，数据也会随之相应变化，以实现特定的汇总要求。

使用Pandas库中的pivot函数，首先需要读取数据生成一个DataFrame数据框。然后，我们可以使用pivot函数来将DataFrame数据框进行重塑。

1. 语法格式

pivot函数的语法格式如下：

DataFrame.pivot(self, index=None, columns=None, values=None)

其中，参数说明如下：

index：设置生成的DataFrame数据框的索引列，默认为None。
columns：设置生成的DataFrame数据框的列名，默认为None。
values：设置生成的DataFrame数据框的值列名，默认为None。

2. 示例

现在我们通过两个示例来详细讲解pivot函数的基础知识点。

示例1

我们首先生成一个DataFrame数据框，如下所示：

import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
        'age': [25, 30, 22, 40, 35],
        'sex': ['F', 'M', 'M', 'M', 'F']}
df = pd.DataFrame(data)

执行上述代码后，我们得到一个包含5个人员信息的DataFrame数据框，共有3个列（name,age,sex）。

现在，我们需要对该DataFrame数据框进行汇总统计，将性别列作为索引，年龄列作为列名，人员数量列作为值。我们可以使用pivot函数来实现，代码如下所示：

pivot_df = df.pivot(index='sex', columns='age', values='name')

上述代码中，我们指定了index参数为‘sex’，columns参数为‘age’，values参数为‘name’。执行该代码后，我们得到了一个重塑后的表格，其中性别列作为索引，年龄列作为列名，人员姓名列作为值。

示例2

我们再通过一个示例来深入理解pivot函数的基础知识点。假设我们有以下交易数据：

import pandas as pd
data = {'date': ['1/1/2020', '1/2/2020', '1/3/2020', '1/1/2020', '1/2/2020', '1/3/2020'],
        'category': ['A', 'B', 'C', 'A', 'B', 'C'],
        'value': [100, 200, 300, 150, 250, 350]}
df = pd.DataFrame(data)

上述代码中，我们生成了一个包含日期、品类、交易金额三列值的DataFrame数据框。

现在，我们需要对该DataFrame数据框进行汇总统计，生成一个以日期为行索引，品类为列名，交易金额为值的新表格。我们可以使用pivot函数来实现，代码如下所示：

pivot_df = df.pivot(index='date', columns='category', values='value')

上述代码中，我们指定了index参数为‘date’，columns参数为‘category’，values参数为‘value’。执行该代码后，我们得到了一个重塑后的表格，其中日期列作为索引，品类列作为列名，交易金额列作为值。

以上是pivot函数的基础知识点的详细讲解和示例说明。通过学习，我们可以灵活运用pivot函数来实现各种场景下的数据处理需求。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python中pivot()函数基础知识点 - Python技术站

python中pivot()函数基础知识点

1. 语法格式

2. 示例

示例1

示例2

相关文章