Pandas是一个功能强大的Python数据分析库,用于处理和分析数据,提供了大量的数据操作、数据分析和数据可视化的功能。在数据分析中,经常需要进行模糊查询与替换的操作,这篇文章将详细介绍Pandas模糊查询与替换的操作攻略,包括以下内容:
- Pandas 模糊查询的操作方式:
使用 Pandas 进行模糊查询可以使用字符串的 str 方法,包括str.match(),str.contains()方法,其中:
-
str.match()方法:匹配字符串的开头,返回匹配结果;
-
str.contains()方法:查询是否包含子串,返回布尔值。
示例一:
假设有一个 data 数据集,包含名字、年龄和薪资信息,请从中筛选出名字以 “A” 开头的员工信息。
import pandas as pd
# 创建数据集
data = {'Name': ['Aiden', 'Alice', 'Ben', 'Bob', 'Alex', 'Anna'],
'Age': [18, 20, 19, 22, 21, 20],
'Salary': [3000, 3200, 3100, 3500, 3400, 3300]
}
df = pd.DataFrame(data)
# 模糊查询名字以 A 开头的员工信息
df[df['Name'].str.match('A')]
输出结果如下:
Name Age Salary
0 Aiden 18 3000
1 Alice 20 3200
4 Alex 21 3400
- Pandas 替换操作的方式:
使用 Pandas 进行替换操作可以使用 replace() 方法,其中:
- replace() 方法:用指定值替换指定的值。
示例二:
假设有一个 data 数据集,包含多个员工的职务信息,请将职务为 Manager 的员工替换为 Director。
import pandas as pd
# 创建数据集
data = {'Name': ['Aiden', 'Alice', 'Ben'],
'Age': [18, 20, 19],
'Position': ['Manager', 'Manager', 'Engineer']
}
df = pd.DataFrame(data)
# 替换职务为 Manager 的员工信息
df['Position'].replace('Manager', 'Director', inplace=True)
print(df)
输出结果如下:
Name Age Position
0 Aiden 18 Director
1 Alice 20 Director
2 Ben 19 Engineer
通过以上示例的操作,我们即可使用 Pandas 实现模糊查询与替换的操作,对于更复杂的场景,也可以根据实际需要进行进一步的操作。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas 模糊查询与替换的操作 - Python技术站