在Pandas中使用 "NOT IN" 过滤器可以通过两种方式实现,即使用 ~ 符号和使用isin() 函数。下面我会详细介绍这两种方式的语法和示例。
使用 ~ 符号:
在Pandas中,如果你想使用 "NOT IN" 过滤器,可以使用 ~ 符号来实现。具体语法如下:
df[~df['column_name'].isin(['value_1', 'value_2'])]
其中 "~" 符号用于取反运算,"df" 代表要过滤的 DataFrame,'column_name' 是要过滤数据的列名, ['value_1', 'value_2'] 是要过滤的数据集合,即不包括 'value_1' 和 'value_2' 的数据。
下面是一个例子,我们在 DataFrame 中过滤不包含 'value_1' 和 'value_2' 的数据,代码如下:
import pandas as pd
# 创建一个字典
data = {'col1': ['a', 'b', 'c', 'd', 'e'],
'col2': [1, 2, 3, 4, 5]}
# 创建一个 DataFrame
df = pd.DataFrame(data)
# 在DataFrame中过滤不包括 'a' 和 'e' 的数据
df_result = df[~df['col1'].isin(['a', 'e'])]
print(df_result)
输出结果如下:
col1 col2
1 b 2
2 c 3
3 d 4
使用 isin() 函数:
还可以使用 isin() 函数来实现去除不需要的数据。这个函数返回布尔索引, 允许我们轻松地获取所需的行。
df[~df['column_name'].isin(['value_1', 'value_2'])]
其中 "~" 符号用于取反,"df" 代表要过滤的 DataFrame,'column_name' 是要过滤数据的列名, ['value_1', 'value_2'] 是要过滤的数据集合。
下面是一个例子,在 DataFrame 中过滤不包含 'value_1' 和 'value_2' 的数据,代码如下:
import pandas as pd
# 创建一个字典
data = {'col1': ['a', 'b', 'c', 'd', 'e'],
'col2': [1, 2, 3, 4, 5]}
# 创建一个 DataFrame
df = pd.DataFrame(data)
# 在DataFrame中过滤不包括 'a' 和 'e' 的数据
df_result = df[~df['col1'].isin(['a', 'e'])]
print(df_result)
输出结果如下:
col1 col2
1 b 2
2 c 3
3 d 4
综上所述,以上就是在 Pandas 中使用 "NOT IN" 过滤器的两种方式及其示例。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何在Pandas中使用 “NOT IN “过滤器 - Python技术站