如何在Pandas中用查询函数根据列值过滤行

2023年3月27日下午1:02 • python-answer

在Pandas中，可以使用查询函数来根据列值过滤行。以下是详细的讲解：

准备数据

首先，需要先准备一组数据。我们可以使用Pandas的DataFrame来存储数据。假设我们要准备一个学生成绩表，包含以下几个字段：姓名（name）、学号（id）、语文成绩（chinese）、数学成绩（math）、英语成绩（english）。

代码如下：

import pandas as pd

data = {
    'name':['张三', '李四', '王五', '赵六', '钱七'],
    'id':[101, 102, 103, 104, 105],
    'chinese':[90, 85, 80, 95, 70],
    'math':[95, 80, 75, 85, 90],
    'english':[80, 85, 90, 75, 80]
}

df = pd.DataFrame(data)

使用查询函数进行过滤

接下来，就可以使用查询函数对数据进行过滤了。Pandas提供了query()函数用于筛选满足指定条件的行。query()函数的语法如下：

df.query('条件')

其中，条件是一个字符串类型的表达式，可以包含列名、比较运算符、逻辑运算符等。例如，要筛选出数学成绩大于90分的学生，可以使用以下语句：

df.query('math > 90')

除了使用标准的比较运算符外，还可以使用in、not in、and、or等逻辑运算符。

例如，要筛选出语文成绩在80到90分之间，并且数学成绩在80分以上的学生，可以使用以下语句：

df.query('chinese >= 80 and chinese <= 90 and math > 80')

还可以使用括号来指定运算优先级，例如，要筛选出语文成绩在80分以上或者数学成绩在90分以上的学生，可以使用以下语句：

df.query('(chinese > 80) | (math > 90)')

这些语句会返回一个新的DataFrame，其中包含满足条件的所有行。

使用布尔索引进行过滤

除了query()函数，还可以使用布尔索引来过滤数据。布尔索引是一种基于条件表达式的索引方法，用于返回数据集中满足条件的所有行。

例如，要筛选出数学成绩大于90分的学生，可以使用以下语句：

df[df['math'] > 90]

类似地，要筛选出语文成绩在80到90分之间，并且数学成绩在80分以上的学生，可以使用以下语句：

df[(df['chinese'] >= 80) & (df['chinese'] <= 90) & (df['math'] > 80)]

这些语句会返回一个新的DataFrame，其中包含满足条件的所有行。

以上就是在Pandas中使用查询函数根据列值过滤行的详细讲解。希望对你有所帮助！

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：如何在Pandas中用查询函数根据列值过滤行 - Python技术站

如何在Pandas中用查询函数根据列值过滤行

相关文章