在Pandas DataFrame中应用if条件的方法

2023年3月27日下午3:32 • python-answer

当我们需要根据某些条件对Pandas DataFrame中的数据进行筛选或操作时，就需要使用到if条件语句。在Pandas DataFrame中应用if条件有多种方法，下面分别介绍其中的两种常用方法，包括：

使用DataFrame的loc方法结合条件语句进行操作；
使用Pandas函数中的where方法结合条件语句进行操作。

方法1. 使用DataFrame的loc方法结合条件语句进行操作

要使用loc方法，首先需要创建一个包含数据的DataFrame。比方说，在下面的示例中，我们创建了一个包含客户姓名、购买日期、购买金额三个变量的DataFrame：

import pandas as pd
df = pd.DataFrame({
    'Name':['Tom', 'Tom', 'Jerry', 'Tom', 'Jerry', 'Jerry'],
    'Date':['2019-03-01','2019-03-02','2019-03-03','2019-03-04','2019-03-05','2019-03-06'],
    'Amount':[100, 200, 300, 150, 250, 350]})

接下来，我们想要筛选出金额大于200的购买记录，可以使用loc方法结合条件语句进行操作。使用loc方法时，需要传入两个参数，第一个参数表示满足条件的行索引，第二个参数则是满足条件的列索引，可以使用“:”表示选择全部列。因此，我们可以编写如下的代码：

df.loc[df['Amount'] > 200, :]

运行代码后，就会得到以下的结果：

     Name        Date  Amount
2   Jerry  2019-03-03     300
4   Jerry  2019-03-05     250
5   Jerry  2019-03-06     350

这个结果就是我们筛选出来的金额大于200的记录。

方法2. 使用Pandas函数中的where方法结合条件语句进行操作

除了使用loc方法外，我们还可以使用Pandas函数中的where方法进行操作。where方法的作用是根据指定条件替换数据。比方说，在下面的示例中，我们先读取一个CSV文件中的数据，然后对其中的数据进行筛选：

import pandas as pd
df = pd.read_csv('data.csv')
df.where(df['Amount'] > 200)

运行代码后，就会得到以下的结果：

     Name        Date  Amount
0     Tom  2019-03-01     NaN
1     Tom  2019-03-02     NaN
2   Jerry  2019-03-03   300.0
3     Tom  2019-03-04     NaN
4   Jerry  2019-03-05   250.0
5   Jerry  2019-03-06   350.0
6     Tom  2019-03-07     NaN
7     Tom  2019-03-08     NaN

可以看到，使用where方法后原来的数据框子被替换成了一个新的数据框。其中，满足条件的金额大于200的行被保留了下来，而不满足条件的行则相关数据被替换成了NaN（空值）。

总之，以上两种方法都可以在Pandas DataFrame中应用if条件，帮助我们实现数据筛选、操作的需求。具体使用时，需要根据具体情况选择不同的方法。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：在Pandas DataFrame中应用if条件的方法 - Python技术站