下面是关于"Pandas中DataFrame数据删除详情"的完整攻略:
1. 删除行和列
在Pandas中,DataFrame数据可以通过drop()函数对其行和列进行删除。该函数的语法如下:
DataFrame.drop(labels=None,axis=0/1, index=None, columns=None, level=None, inplace=False, errors='raise')
其中,各参数的含义如下:
- labels:要删除的行列标签(行和列都可以,具体由axis参数决定)。
- axis:默认0,指删除行。可选值为1,指删除列。
- index:要删除行的标签。
- columns:要删除列的标签。
- level:对于深层次的行列索引,指定要删除的级别。
- inplace:默认False,指定操作是否原地进行。如果为True,则直接修改DataFrame对象本身。
- errors:默认为'raise',指定是否抛出异常。如果为'raise',则会在标签不存在时抛出KeyError异常;如果为'ignore'则不抛出异常。
示例1:删除指定行
import pandas as pd
# 创建示例DataFrame数据
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]
}, index=['a', 'b', 'c'])
# 删除指定行
df.drop(['a', 'c'], inplace=True)
print(df)
输出结果:
A B C
b 2 5 8
示例2:删除指定列
import pandas as pd
# 创建示例DataFrame数据
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]
}, index=['a', 'b', 'c'])
# 删除指定列
df.drop(['B'], axis=1, inplace=True)
print(df)
输出结果:
A C
a 1 7
b 2 8
c 3 9
2. 删除重复行
在Pandas中,可以使用drop_duplicates()函数删除DataFrame数据中的重复行。该函数的语法如下:
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
其中各参数的含义如下:
- subset:指定哪些列进行去重。默认None,表示所有列均参与去重。
- keep:默认为'first',表示保留第一次出现的行,可以设置为'last',表示保留最后一次出现的行。
- inplace:默认为False,表示不修改原数据,而是返回去重后的新数据,如果设置为True,则直接在原数据上进行修改。
- ignore_index:默认为False,表示不重新对索引进行编号,如果为True,则重新进行编号。
示例3:删除重复行
import pandas as pd
# 创建示例DataFrame数据
df = pd.DataFrame({
'A': [1, 2, 2, 3, 4],
'B': [2, 3, 2, 4, 5],
'C': [4, 2, 3, 4, 5]
})
# 删除重复行
df.drop_duplicates(inplace=True)
print(df)
输出结果:
A B C
0 1 2 4
1 2 3 2
2 3 4 4
3 4 5 5
以上就是关于"Pandas中DataFrame数据删除详情"的完整攻略了。希望对你有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas中DataFrame数据删除详情 - Python技术站