如何使用Pandas的apply()来代替

2023年3月27日下午2:52 • python-answer

当我们需要对Pandas的DataFrame或Series的每个元素进行操作时，可以使用apply()方法。apply()方法可以对一维、二维数据等多种数据类型进行操作。

下面是使用Pandas的apply()方法进行操作的完整攻略步骤：

步骤1：导入相关库

在开始前，需要导入Pandas库，并通过以下代码导入：

import pandas as pd

步骤2：创建样例数据集并加载到DataFrame中

接下来，为提供一个说明，我们将创建一个数据集并加载到DataFrame中：

data = {'first':['jack', 'bob', 'alice'], 'last':['smith', 'peter', 'smith'], 'age':[34, 52, 26]}
df = pd.DataFrame(data)

执行上述代码将创建以下DataFrame：

   first   last    age
0   jack  smith    34
1    bob  peter    52
2  alice  smith    26

步骤3：使用apply()方法对每个元素进行操作

现在，我们将使用apply()方法对每个元素进行操作。在本例中，我们将对“age”列中的每个值加10。使用以下代码：

def add_ten(x):
    return x+10

df['age'] = df['age'].apply(add_ten)

print(df)

在上面的代码中，首先定义了一个函数add_ten()，该函数将输入值（x）加上10并返回结果。接下来，我们使用apply()方法来将add_ten()函数应用于“age”列中的每个元素。输出结果如下：

   first   last    age
0   jack  smith    44
1    bob  peter    62
2  alice  smith    36

可以看出，“age”列中的每个值现在都增加了10。

步骤4：使用lambda函数代替自定义函数

在上面的示例中，我们通过定义add_ten()函数来使用apply()方法进行操作。但是，对于简单的操作，您可以使用lambda函数代替自定义函数。例如，我们可以使用以下代码修改步骤3中的代码：

df['age'] = df['age'].apply(lambda x: x+10)

print(df)

使用lambda函数可以使代码更加简洁和易懂。结果与步骤3中的示例相同。

步骤5：使用apply()方法对每行或每列进行操作

除了可以对一维数据进行操作外，Pandas的apply()方法还可以对二维数据进行操作，如DataFrame中的每一行或每一列。在这种情况下，我们需要设置axis参数的值。如果要应用于每行，则将axis设置为1。如果要应用于每列，则将axis设置为0。例如，我们可以使用以下示例代码：

df[['age', 'income']] = df[['age', 'income']].apply(lambda x: x+10, axis=1)

print(df)

在上述示例中，我们对“age”和“income”列中的每个元素都添加了10。输出结果如下：

   first   last  age  income
0   jack  smith   44     120
1    bob  peter   62     150
2  alice  smith   36     200

注意：在对二维数据进行操作时，您必须明确指定应用操作的列或行。在上述示例中，我们只对“age”和“income”列进行操作。如果要对所有列进行操作，则需要使用df.apply(lambda x: x+10, axis=1)。

以上就是使用Pandas的apply()进行操作的完整攻略步骤。通过apply()方法，我们可以更方便地进行数据操作，同时可以使代码更加简洁和易于理解。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：如何使用Pandas的apply()来代替 - Python技术站