当我们需要从 Pandas 数据框架中筛选出符合特定条件的数据时,就需要用到多个条件过滤。下面是一个完整的攻略,包括代码示例和具体步骤:
1. 导入所需模块
我们需要导入 Pandas 库和数据框架,示例数据为一个用户数据表格:
import pandas as pd
user_data = pd.read_csv("user_data.csv")
print(user_data.head())
2. 单条件过滤
首先,我们可以使用 []
操作符,传入单个条件,来满足单条件的过滤:
# 筛选用户年龄大于30的数据
age_above_30 = user_data[user_data["age"] > 30]
print(age_above_30)
3. 多条件过滤
如果要同时满足多个条件,我们可以使用 &
连接多个条件:
# 筛选用户年龄大于30且所在城市为北京的数据
age_and_location = user_data[(user_data["age"] > 30) & (user_data["city"] == "北京")]
print(age_and_location)
4. 模糊匹配
除了精确匹配,我们还可以使用 str.contains
方法进行模糊匹配:
# 筛选用户所在城市包含“京”的数据
city_contain_jing = user_data[user_data["city"].str.contains("京")]
print(city_contain_jing)
5. 处理空值
如果数据中存在空值,可以使用 isnull()
和 notnull()
方法进行判断,例如:
# 筛选用户名和邮箱都不为空的数据
not_null_data = user_data[user_data["name"].notnull() & user_data["email"].notnull()]
print(not_null_data)
6. 列索引
有时候我们需要只保留数据中特定的列,可以使用 []
操作符获取指定的列:
# 只保留用户的姓名和年龄
name_and_age = user_data[["name", "age"]]
print(name_and_age)
以上就是用多个条件过滤 Pandas 数据框架的完整攻略,希望能够对你有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:用多个条件过滤Pandas数据框架 - Python技术站