如何在Pandas中使用 “NOT IN “过滤器

Pandas中使用 "NOT IN" 过滤器可以通过两种方式实现,即使用 ~ 符号和使用isin() 函数。下面我会详细介绍这两种方式的语法和示例。

使用 ~ 符号:

在Pandas中,如果你想使用 "NOT IN" 过滤器,可以使用 ~ 符号来实现。具体语法如下:

df[~df['column_name'].isin(['value_1', 'value_2'])]

其中 "~" 符号用于取反运算,"df" 代表要过滤的 DataFrame,'column_name' 是要过滤数据的列名, ['value_1', 'value_2'] 是要过滤的数据集合,即不包括 'value_1' 和 'value_2' 的数据。

下面是一个例子,我们在 DataFrame 中过滤不包含 'value_1' 和 'value_2' 的数据,代码如下:

import pandas as pd

# 创建一个字典
data = {'col1': ['a', 'b', 'c', 'd', 'e'],
        'col2': [1, 2, 3, 4, 5]}

# 创建一个 DataFrame
df = pd.DataFrame(data)

# 在DataFrame中过滤不包括 'a' 和 'e' 的数据
df_result = df[~df['col1'].isin(['a', 'e'])]

print(df_result)

输出结果如下:

  col1  col2
1   b     2
2   c     3
3   d     4

使用 isin() 函数:

还可以使用 isin() 函数来实现去除不需要的数据。这个函数返回布尔索引, 允许我们轻松地获取所需的行。

df[~df['column_name'].isin(['value_1', 'value_2'])]

其中 "~" 符号用于取反,"df" 代表要过滤的 DataFrame,'column_name' 是要过滤数据的列名, ['value_1', 'value_2'] 是要过滤的数据集合。

下面是一个例子,在 DataFrame 中过滤不包含 'value_1' 和 'value_2' 的数据,代码如下:

import pandas as pd

# 创建一个字典
data = {'col1': ['a', 'b', 'c', 'd', 'e'],
        'col2': [1, 2, 3, 4, 5]}

# 创建一个 DataFrame
df = pd.DataFrame(data)

# 在DataFrame中过滤不包括 'a' 和 'e' 的数据
df_result = df[~df['col1'].isin(['a', 'e'])]

print(df_result)

输出结果如下:

  col1  col2
1   b     2
2   c     3
3   d     4

综上所述,以上就是在 Pandas 中使用 "NOT IN" 过滤器的两种方式及其示例。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何在Pandas中使用 “NOT IN “过滤器 - Python技术站

(1)
上一篇 2023年3月27日
下一篇 2023年3月27日

相关文章

  • 如何在Pandas中删除第一行

    在 Pandas 中删除 DataFrame 中的第一行可以通过以下步骤实现: 导入 Pandas 库 在代码的开头,需要导入 Pandas 库: import pandas as pd 读取数据 需要读取需要删除第一行的 DataFrame 数据。可以从 CSV 文件、Excel 文件等格式中读取数据。 例如,读取一个名为 data.csv 的 CSV 文…

    python-answer 2023年3月27日
    00
  • 对python dataframe逻辑取值的方法详解

    对Python DataFrame逻辑取值的方法详解 在数据分析和数据处理中,经常需要对数据进行逻辑筛选。Python DataFrame 是一个强大的数据结构,它提供了多种方式进行逻辑取值。本文将介绍 Pandas 中基本的逻辑操作和函数,并提供示例代码和结果。 一、逻辑操作 在进行逻辑操作时需要注意以下几个细节: 多条件筛选时,需要使用括号进行分组(尤其…

    python 2023年5月14日
    00
  • 如何从Pandas DataFrame中获取单元格值

    获取Pandas DataFrame中单元格的值通常需要使用DataFrame的loc和iloc方法。 1. loc方法 loc方法一般用于使用行和列的名称获取单元格值。可以按以下格式使用loc方法: DataFrame.loc[row_label, column_label] 其中,row_label表示行标签,column_label表示列标签。可以使用…

    python-answer 2023年3月27日
    00
  • pandas中DataFrame修改index、columns名的方法示例

    下面是详细讲解“pandas中DataFrame修改index、columns名的方法示例”的完整攻略: 修改DataFrame的index 在pandas中,我们可以通过set_index()方法修改DataFrame的index。该方法接收一个或多个列名作为参数,将这些列作为新的index,原有的index则被舍弃。 import pandas as p…

    python 2023年5月14日
    00
  • pandas pd.cut()与pd.qcut()的具体实现

    当我们需要将连续性数据进行离散化时,pandas中提供了两个方法pd.cut()和pd.qcut()。pd.cut()是基于指定的区间对数据进行划分,而pd.qcut()则是面向数据分布的方式进行划分。下面将具体介绍这两个方法的使用。 pd.cut() 基本结构 pandas.cut(x, bins, right=True, labels=None, ret…

    python 2023年5月14日
    00
  • pandas中DataFrame数据合并连接(merge、join、concat)

    下面我来详细讲解一下pandas中DataFrame数据合并连接的攻略。 1. 数据合并介绍 在实际的数据分析中,我们通常需要将多个数据源合并成一个数据源,这时就需要用到数据合并技术。在pandas库中,常用的数据合并方式有merge、join、concat三种,下面分别介绍它们的用法。 2. merge合并 pandas中的merge()函数是实现两张表之…

    python 2023年5月14日
    00
  • Pandas Series结构对象的创建与访问方法

    Pandas Series结构是什么? Pandas Series是一种类似于一维数组的数据结构,可以存储任意类型的数据,包括整数、浮点数、字符串、Python对象等。Series有两个主要的部分:索引和值,其中索引用于标识每个值的位置,可以是整数、字符串或其他数据类型。Series中的每个值都与一个索引值对应,因此可以通过索引来访问数据。Series的特点…

    Pandas 2023年3月4日
    00
  • Pandas之Dropna滤除缺失数据的实现方法

    一、Dropna的基本用法 Pandas中的dropna函数是用来滤除缺失数据的。具体如何实现呢?让我们首先来看一下dropna函数的基本用法。 函数定义: DataFrame.dropna( axis=0, # 行或列 how=’any’, # 如果遇到缺失数据对应的行或列是any或all的话将会被滤除 thresh=None, # 非空数据点数的阈值,取…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部