当我们使用pandas进行数据分析及处理时,经常需要对数据中的某些值进行替换。pandas提供了多种方法进行值替换,包括以下几种:
1. pandas.DataFrame.replace()方法
使用pandas.DataFrame.replace()方法可以简单地完成值替换。
import pandas as pd
import numpy as np
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e'],
'C': ['low', 'high', 'medium', 'low', 'high']
})
# 用3替换C列中的low值
df.replace('low', 3, inplace=True)
print(df)
输出:
A B C
0 1 a 3
1 2 b high
2 3 c medium
3 4 d 3
4 5 e high
在上面的示例中,我们使用replace()方法把C列中的'low'替换成3。
2. pandas.DataFrame.replace()方法(字典形式)
使用replace()方法还可以使用字典的形式进行多值替换。
import pandas as pd
import numpy as np
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e'],
'C': ['low', 'high', 'medium', 'low', 'high']
})
# 用字典形式替换值
replace_dict = {'low':3, 'high':10}
df.replace(replace_dict, inplace=True)
print(df)
输出:
A B C
0 1 a 3
1 2 b 10
2 3 c medium
3 4 d 3
4 10 e 10
在这个例子中,我们使用了字典的形式替换C列中所有'low'用3,所有'high'用10。
总结:pandas.DataFrame.replace()方法使用简单,可以快速完成单值、多值替换。
另外,还可以使用python中的map()和apply()方法进行替换,操作方式略有不同,需要根据具体的数据结构进行操作。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas值替换方法 - Python技术站