pandas is in和not in的使用说明

Pandasisin和Notin的使用说明

Pandasisin和Notin的作用

Pandasisin和Notin是用于过滤数据的两个常用方法,可以筛选数据集中符合某些条件的数据,可以用于数据清洗或处理中。

Pandasisin和Notin的语法

pandasisin函数的语法如下:

DataFrame.column_name.isin(values_list)

notin函数的语法如下:

~DataFrame.column_name.isin(values_list)

其中,values_list参数是一个列表,包含需要进行筛选的值。而在notin函数中,利用~符号对结果取反,表示只筛选不在列表中的值。

Pandasisin和Notin的示例

下面通过实例说明如何使用pandasisinnotin进行数据筛选。

示例1

假设我们有一个包含商品名称、价格和库存量的数据集,我们希望找到所有价格为50或100的商品信息。使用pandasisin函数可以轻松实现:

import pandas as pd

data = {
    'product': ['A', 'B', 'C', 'D', 'E'],
    'price': [50, 30, 100, 80, 120],
    'stock': [10, 20, 5, 7, 3]
}

df = pd.DataFrame(data)

result = df[df['price'].isin([50, 100])]
print(result)

输出结果如下所示:

  product  price  stock
0       A     50     10
2       C    100      5

示例2

假设我们有一个包含多个城市旅游景点名称、评分和门票价格的数据集,我们希望找到4个城市的旅游景点信息,这四个城市分别是“北京”、“上海”、“广州”和“深圳”,使用notin函数可以轻松实现:

import pandas as pd

data = {
    'city': ['北京', '上海', '广州', '深圳', '成都', '重庆', '杭州', '南京', '武汉', '长沙'],
    'attraction': ['故宫', '东方明珠', '长隆', '世界之窗', '宽窄巷子', '洪崖洞', '西湖', '中山陵', '黄鹤楼', '岳麓山'],
    'score': [9.0, 8.8, 8.6, 9.2, 8.5, 8.7, 9.1, 8.9, 8.4, 8.3],
    'price': [60, 110, 230, 280, 50, 60, 80, 90, 40, 70]
}

df = pd.DataFrame(data)

result = df[~df['city'].isin(['成都', '重庆', '杭州', '南京'])]
print(result)

输出结果如下所示:

  city attraction  score  price
0  北京        故宫    9.0     60
1  上海      东方明珠    8.8    110
2  广州        长隆    8.6    230
3  深圳     世界之窗    9.2    280
8  武汉       黄鹤楼    8.4     40
9  长沙       岳麓山    8.3     70

如上所示,通过notin函数,我们可以快速筛选掉四个城市的旅游景点,保留其他城市的数据信息。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas is in和not in的使用说明 - Python技术站

(1)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Python 切片为什么不会索引越界?

    Python中的切片是一种从字符串、列表、元组中获取子集的方法,它可以通过[start:end]或[start:end:step]的形式来获取一个序列的子序列。在使用切片时,我们可能会担心是否会发生索引越界的情况,但是实际上Python中的切片不会出现这种情况。下面我将详细讲解Python切片为什么不会索引越界的原理。 切片的原理 在Python中,当我们使…

    python 2023年5月14日
    00
  • Pandas提取数据的三种方式

    下面是Pandas提取数据的三种方式的完整攻略,共包含三种方法: 1. 按行、按列提取数据方法 按行提取数据 Pandas可以通过 loc 和 iloc 方法按行提取数据。 其中,loc 方法使用标签来定位数据,iloc 方法使用索引来定位数据。以下是示例代码: import pandas as pd # 使用pandas读取本地csv文件 df = pd.…

    python 2023年5月14日
    00
  • 基于Python数据分析之pandas统计分析

    下面是关于“基于Python数据分析之pandas统计分析”的完整攻略。 1. pandas的基本介绍 pandas是Python中一个强大的数据处理框架,它提供了灵活的数据结构和数据分析工具,特别适用于处理表格型数据。其主要的数据结构包括序列(Series)和数据框(DataFrame),可以处理各种格式的数据。pandas还提供了聚合、变换、合并和重塑等…

    python 2023年5月14日
    00
  • Python Pandas.factorize()

    让我们来详细讲解Python Pandas.factorize()方法的完整攻略。 一、Pandas.factorize()方法介绍 Pandas.factorize()方法用于将一列中的离散型数据转换成连续的数值型数据。它返回一个元组,包含两个数组,第一个数组是每个唯一值的编码,第二个数组是唯一的、有序的值。 二、Pandas.factorize()方法使…

    python-answer 2023年3月27日
    00
  • 如何在Pandas中删除索引列

    在 Pandas 中,我们可以使用 drop() 方法删除 DataFrame 中的某一列。要删除索引列,我们需要设置 axis=1 参数,因为在 Pandas 中,0 表示行,1 表示列。下面是详细的步骤和代码示例: 读取数据,创建 DataFrame 首先,我们需要读取数据,创建一个 DataFrame。这里,我们使用 pd.read_csv() 方法从…

    python-answer 2023年3月27日
    00
  • 在Python Pandas 中从日期中提取周数

    在Python Pandas中,我们可以使用dt.week获取某个日期属于当年的第几周。下面是从日期中提取周数的具体步骤: 1.导入Pandas: 我们需要先在Python中导入Pandas库,可以使用以下代码实现: import pandas as pd 2.创建日期序列: 我们需要先创建一个日期序列,这里我们使用Pandas的date_range()函数…

    python-answer 2023年3月27日
    00
  • 在Pandas数据框架中,将列的类型从字符串转换为日期时间格式

    在Pandas数据框架中,将列的类型从字符串转换为日期时间格式需要以下步骤: 导入Pandas库 在代码中加入下面的语句来导入pandas库,作为基础运行环境: import pandas as pd 读入数据 我们读入CSV文件作为数据来源。假设我们读入的CSV文件是“data.csv”,我们需要使用下面的代码来读取数据: df = pd.read_csv…

    python-answer 2023年3月27日
    00
  • Pandas 连接合并函数merge()详解

    Pandas连接合并函数merge()详解 在pandas中,merge函数用于将两个数据集按照某些规则合并为一个数据集。本文将详细讲解merge函数的用法和示例。 merge函数的分类 merge有四种连接方式: 内连接(inner join) 左连接(left join) 右连接(right join) 外连接(outer join) merge函数的基…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部