pandas is in和not in的使用说明

Pandasisin和Notin的使用说明

Pandasisin和Notin的作用

Pandasisin和Notin是用于过滤数据的两个常用方法,可以筛选数据集中符合某些条件的数据,可以用于数据清洗或处理中。

Pandasisin和Notin的语法

pandasisin函数的语法如下:

DataFrame.column_name.isin(values_list)

notin函数的语法如下:

~DataFrame.column_name.isin(values_list)

其中,values_list参数是一个列表,包含需要进行筛选的值。而在notin函数中,利用~符号对结果取反,表示只筛选不在列表中的值。

Pandasisin和Notin的示例

下面通过实例说明如何使用pandasisinnotin进行数据筛选。

示例1

假设我们有一个包含商品名称、价格和库存量的数据集,我们希望找到所有价格为50或100的商品信息。使用pandasisin函数可以轻松实现:

import pandas as pd

data = {
    'product': ['A', 'B', 'C', 'D', 'E'],
    'price': [50, 30, 100, 80, 120],
    'stock': [10, 20, 5, 7, 3]
}

df = pd.DataFrame(data)

result = df[df['price'].isin([50, 100])]
print(result)

输出结果如下所示:

  product  price  stock
0       A     50     10
2       C    100      5

示例2

假设我们有一个包含多个城市旅游景点名称、评分和门票价格的数据集,我们希望找到4个城市的旅游景点信息,这四个城市分别是“北京”、“上海”、“广州”和“深圳”,使用notin函数可以轻松实现:

import pandas as pd

data = {
    'city': ['北京', '上海', '广州', '深圳', '成都', '重庆', '杭州', '南京', '武汉', '长沙'],
    'attraction': ['故宫', '东方明珠', '长隆', '世界之窗', '宽窄巷子', '洪崖洞', '西湖', '中山陵', '黄鹤楼', '岳麓山'],
    'score': [9.0, 8.8, 8.6, 9.2, 8.5, 8.7, 9.1, 8.9, 8.4, 8.3],
    'price': [60, 110, 230, 280, 50, 60, 80, 90, 40, 70]
}

df = pd.DataFrame(data)

result = df[~df['city'].isin(['成都', '重庆', '杭州', '南京'])]
print(result)

输出结果如下所示:

  city attraction  score  price
0  北京        故宫    9.0     60
1  上海      东方明珠    8.8    110
2  广州        长隆    8.6    230
3  深圳     世界之窗    9.2    280
8  武汉       黄鹤楼    8.4     40
9  长沙       岳麓山    8.3     70

如上所示,通过notin函数,我们可以快速筛选掉四个城市的旅游景点,保留其他城市的数据信息。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas is in和not in的使用说明 - Python技术站

(1)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • pandas dataframe的合并实现(append, merge, concat)

    下面是Pandas DataFrame的合并实现攻略: 1. Pandas DataFrame合并操作的几种实现方法 Pandas DataFrame合并操作主要包括append、merge和concat三种方法。这三种方法的具体实现方式和适用场景有所不同,下面将分别进行介绍。 1.1 Pandas DataFrame中的append方法 append方法可…

    python 2023年5月14日
    00
  • Pandas描述性统计常用的方法

    什么是描述性统计? 描述统计学(descriptive statistics)是一门统计学领域的学科,是一种利用某些指标对数据进行概括和描述的一种统计方法。 描述性统计通过统计数据的集中趋势、离散程度、分布形态、相关性等特征来描述数据的基本情况和规律,常用于数据分析、数据挖掘、商业分析等领域。常见的描述性统计指标包括均值、中位数、标准差、方差、极差、四分位数…

    Pandas 2023年3月4日
    00
  • pandas数据清洗,排序,索引设置,数据选取方法

    下面是“pandas数据清洗,排序,索引设置,数据选取方法”的完整攻略。 Pandas数据清洗 在Pandas中,我们常常需要对数据进行清洗,以提高数据质量和可用性。数据清洗的过程包括数据去重,缺失值处理,数据类型转换,字符串处理等。 数据去重 在Pandas中,可以使用drop_duplicates()方法去掉DataFrame中的重复记录。该方法默认以所…

    python 2023年5月14日
    00
  • Python 利用高德地图api实现经纬度与地址的批量转换

    下面是详细的攻略。 准备工作 首先需要申请高德地图的开发者账号,并创建一个应用,获取高德地图api的key。然后在本地安装Python,并安装requests模块。 高德地图api 从高德地图官网得知,通过高德地图web服务API可以实现地址和经纬度之间的转换。具体来说,我们需要用到http://restapi.amap.com/v3/geocode/geo…

    python 2023年6月13日
    00
  • 从Pandas数据框架中的行创建一个列表

    从Pandas数据框架中的行创建一个列表通常有以下几个步骤: 步骤1:导入必要的库 在使用Pandas数据框架创建列表之前,需要导入Pandas库和任何其他需要使用的库。可以使用以下语句导入它们: import pandas as pd 步骤2:创建数据框 在创建行的列表之前,需要先创建一个数据框。数据框是Pandas库中最常用的数据结构之一,可以是二维的表…

    python-answer 2023年3月27日
    00
  • python数据分析近年比特币价格涨幅趋势分布

    为了进行“python数据分析近年比特币价格涨幅趋势分布”的分析,我们需要先完成以下步骤: 获取比特币价格数据 对比特币价格数据进行处理,得到每天的价格变动趋势 计算每天的价格变动幅度 使用统计学方法绘制价格变动幅度的分布图 步骤一:获取比特币价格数据 我们可以使用以下方法获取比特币价格数据: import requests URL = ‘https://a…

    python 2023年5月14日
    00
  • 在Pandas中把列名转换成行名/索引

    在Pandas中,我们可以使用melt函数进行将列名转换成行名/索引的操作。下面是具体的操作步骤: 读取数据源,将数据源存入DataFrame中 import pandas as pd df = pd.read_csv(‘data.csv’) 使用melt函数,将指定的列转换为行索引,剩余的列成为新的列名和值。 id_vars = [‘col1’] # 指定…

    python-answer 2023年3月27日
    00
  • python如何导入自己的模块

    当我们想要在Python中使用自己定义的模块时,需要进行导入操作。下面详细介绍Python如何导入自己的模块。 1. 自定义模块文件的结构 在编写自定义模块之前,需要确认文件结构。Python模块可以是一个包含Python方法的.py文件。常见的模块结构如下: project/ ├── main.py └── mymodule/ ├── __init__.p…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部