如何在Pandas中使用 “NOT IN “过滤器

Pandas中使用 "NOT IN" 过滤器可以通过两种方式实现,即使用 ~ 符号和使用isin() 函数。下面我会详细介绍这两种方式的语法和示例。

使用 ~ 符号:

在Pandas中,如果你想使用 "NOT IN" 过滤器,可以使用 ~ 符号来实现。具体语法如下:

df[~df['column_name'].isin(['value_1', 'value_2'])]

其中 "~" 符号用于取反运算,"df" 代表要过滤的 DataFrame,'column_name' 是要过滤数据的列名, ['value_1', 'value_2'] 是要过滤的数据集合,即不包括 'value_1' 和 'value_2' 的数据。

下面是一个例子,我们在 DataFrame 中过滤不包含 'value_1' 和 'value_2' 的数据,代码如下:

import pandas as pd

# 创建一个字典
data = {'col1': ['a', 'b', 'c', 'd', 'e'],
        'col2': [1, 2, 3, 4, 5]}

# 创建一个 DataFrame
df = pd.DataFrame(data)

# 在DataFrame中过滤不包括 'a' 和 'e' 的数据
df_result = df[~df['col1'].isin(['a', 'e'])]

print(df_result)

输出结果如下:

  col1  col2
1   b     2
2   c     3
3   d     4

使用 isin() 函数:

还可以使用 isin() 函数来实现去除不需要的数据。这个函数返回布尔索引, 允许我们轻松地获取所需的行。

df[~df['column_name'].isin(['value_1', 'value_2'])]

其中 "~" 符号用于取反,"df" 代表要过滤的 DataFrame,'column_name' 是要过滤数据的列名, ['value_1', 'value_2'] 是要过滤的数据集合。

下面是一个例子,在 DataFrame 中过滤不包含 'value_1' 和 'value_2' 的数据,代码如下:

import pandas as pd

# 创建一个字典
data = {'col1': ['a', 'b', 'c', 'd', 'e'],
        'col2': [1, 2, 3, 4, 5]}

# 创建一个 DataFrame
df = pd.DataFrame(data)

# 在DataFrame中过滤不包括 'a' 和 'e' 的数据
df_result = df[~df['col1'].isin(['a', 'e'])]

print(df_result)

输出结果如下:

  col1  col2
1   b     2
2   c     3
3   d     4

综上所述,以上就是在 Pandas 中使用 "NOT IN" 过滤器的两种方式及其示例。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何在Pandas中使用 “NOT IN “过滤器 - Python技术站

(1)
上一篇 2023年3月27日
下一篇 2023年3月27日

相关文章

  • 如何查找和删除Pandas数据框架中的重复列

    当我们使用Pandas进行数据分析时,数据集中可能会存在重复列。重复列是指数据框架中存在两列或更多列具有相同的列名和列数据,这可能会对后续的数据分析造成困扰,因此我们需要对数据框架进行检查,以查找和删除重复列。 以下是查找和删除Pandas数据框架中重复列的完整攻略: 1. 查找重复列 可以使用duplicated()函数来查找数据框架中重复的列。该函数将数…

    python-answer 2023年3月27日
    00
  • Python如何识别 MySQL 中的冗余索引

    针对“Python如何识别 MySQL 中的冗余索引”的问题,我提供以下完整攻略: 理解冗余索引 在开始之前,我们需要先理解什么是冗余索引。冗余索引是指在表中已经有索引覆盖了某个字段,但是又在该字段上建立了另外的索引,此时新建的索引便是冗余索引。冗余索引的存在不仅不会优化查询效率,反而会增加插入、更新和删除的操作时间。 使用 Python 识别冗余索引 Py…

    python 2023年6月13日
    00
  • 如何使用IQR的Pandas过滤器

    当我们需要处理大型数据集时,Pandas是一个非常流行和强大的工具。其中,过滤是处理数据集的一个常见操作,而IQR(四分位间距)的概念可以帮助我们在数据的不同部分之间进行筛选和分析。 以下是如何使用IQR的Pandas过滤器的步骤: 第一步:导入pandas和numpy库 import pandas as pd import numpy as np 第二步:…

    python-answer 2023年3月27日
    00
  • 基于Python实现帕累托图的示例详解

    基于Python实现帕累托图的示例详解 什么是帕累托图 帕累托图(Pareto Chart)也叫帕累托分析法,是利用帕累托原理(二八法则)和梯度图的基础上绘制出的图形,又称二八图。它是管理质量控制和精益制造中的一种工具,目的是通过图形的形式使人们能够快速地了解哪些因素是最重要的。它可以在产品设计、质量改进、进度控制等方面获得广泛应用。帕累托图通常由两个轴组成…

    python 2023年6月13日
    00
  • pandas的qcut()方法详解

    pandas的qcut()方法详解 1. 什么是qcut()方法 pandas的qcut()方法是用于对数据进行分箱(binning)处理的函数,该函数可以根据指定的分位数(quantile)将数据划分为多个区间(box)。 2. qcut()方法的语法 pandas.qcut(x, q, labels=None, retbins=False, precis…

    python 2023年5月14日
    00
  • Python 用Pandas .query()方法过滤数据

    Pandas是一种开源数据分析工具,它提供了大量数据操作和分析功能,其中Pandas.query()方法是一种方便的数据过滤方法,本文将提供有关Python中如何使用Pandas.query()方法过滤数据的完整攻略,并提供相关实例。 1. Pandas.query()方法概述 Pandas.query()方法可以对DataFrame数据集进行查询,这个函数…

    python-answer 2023年3月27日
    00
  • 如何在索引上合并两个Pandas数据框架

    要合并两个Pandas数据框架(dataframe),需要使用Pandas库中的merge函数。这个函数可以根据指定的列将两个数据框架合并为一个。以下是合并数据框架的详细步骤。 准备数据 首先,我们准备两个数据框架,每个数据框架都有一列用作索引(index),而且这两个数据框架包含的索引值有重叠。 import pandas as pd # 准备第一个数据框…

    python-answer 2023年3月27日
    00
  • Pandas的MultiIndex多层索引使用说明

    Pandas的MultiIndex多层索引使用说明 Pandas中的MultiIndex多层索引是一个强大的功能,可以让我们在一个数据框中使用多个层级的索引,方便我们进行数据探索和分析。本文将详细讲解MultiIndex多层索引的使用,包括创建、切片、索引等等。 创建MultiIndex多层索引 在Pandas中,我们可以通过下面的方式来创建一个MultiI…

    python 2023年6月13日
    00
合作推广
合作推广
分享本页
返回顶部