pandas 查询函数query的用法说明

下面是关于pandas查询函数query的用法说明的完整攻略。

1. 简介

Pandas是一种数据处理工具，在数据处理的过程中，经常需要进行数据筛选，查询等操作。Pandas提供了一个强大的查询函数query，可以帮助我们更方便地进行数据查询和筛选操作。

query函数的基本语法为：

DataFrame.query(expr, inplace=False, **kwargs)

其中，expr为查询表达式，inplace设为True时表示将修改原有DataFrame数据。

查询表达式可以使用列名和运算符来实现，最常用的运算符是==, !=, >, <, >=, <=。

例如，我们有一份成绩单数据表，可以按照分数、班级、科目等条件进行查询，示例数据如下：

现在我们想查询一年级一班语文成绩大于等于80分的学生，我们可以使用query函数来实现：

import pandas as pd

df = pd.read_excel('成绩单.xlsx')
df.query('年级 == "一年级" and 班级 == "一班" and 语文成绩 >= 80')

注：在读取Excel文件时，需要安装xlrd库

以上代码的查询表达式为'年级 == "一年级" and 班级 == "一班" and 语文成绩 >= 80'，其中and表示与的关系，>=表示大于等于的关系。

运行以上代码，查询结果为：

   学生    年级  班级  语文成绩  数学成绩  英语成绩
0  张三  一年级  一班     80     70     90

该结果即为符合条件的查询结果。

除了上述示例中的简单查询外，query函数还支持更复杂的查询。

例如，我们现在想查询所有成绩中，姓名中包含“张”或“李”，并且数学成绩大于英语成绩的学生。这个查询条件比较复杂，我们可以使用以下代码进行查询：

df.query('(学生.str.contains("张") or 学生.str.contains("李")) and 数学成绩 > 英语成绩')

以上查询表达式中，str.contains表示包含关系，or表示或的关系，括号用于分组，以保证查询语句的正确性。

运行以上代码，查询结果为：

   学生    年级  班级  语文成绩  数学成绩  英语成绩
1  李四  一年级  二班     90     80     70

符合条件的查询结果即为该数据表中的李四同学。

以上就是关于pandas查询函数query的简要介绍和用法说明，query函数可以方便地实现数据表格中的多条件查询，可帮助我们更高效地进行数据处理和分析。

阅读剩余 41%

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pandas 查询函数query的用法说明 - Python技术站