pandas系列之DataFrame行列数据筛选实例
Dataframe是pandas中极为重要的数据结构之一,其由行和列构成,类似于电子表格或SQL表。本文将对DataFrame中的行列数据筛选操作进行详细讲解,包括loc、iloc、ix、以及Boolean indexing等方法。
loc方法
loc是pandas中的一种基于标签的索引方法,用于获取指定行和列的数据。用法为df.loc[行标签, 列标签]
。
下面的代码展示了如何使用loc方法获取指定行和列的数据:
import pandas as pd
# 创建DataFrame
data = {
'name': ['Tom', 'Jerry', 'Mike'],
'age': [21, 22, 23],
'gender': ['male', 'male', 'female'],
'score': [90, 80, 85]
}
df = pd.DataFrame(data)
# 使用loc方法选取第一行和第二列的数据
print(df.loc[0,'age'])
上述代码中,使用了loc方法选取了第一行和第二列的数据。
iloc方法
iloc是pandas中的一种基于位置的索引方法,用于获取指定行和列的数据。用法为df.iloc[行位置, 列位置]
。
下面的代码展示了如何使用iloc方法获取指定行和列的数据:
import pandas as pd
# 创建DataFrame
data = {
'name': ['Tom', 'Jerry', 'Mike'],
'age': [21, 22, 23],
'gender': ['male', 'male', 'female'],
'score': [90, 80, 85]
}
df = pd.DataFrame(data)
# 使用iloc方法选取前两行和前两列的数据
print(df.iloc[:2,:2])
上述代码中,使用了iloc方法选取了前两行和前两列的数据。
Boolean indexing
Boolean indexing是pandas中一种比较强大的筛选数据的方法,它可以根据DataFrame中某一列的数值或某一行的某个值是否满足一定条件来进行高效的数据筛选。
下面的代码展示了如何使用Boolean indexing进行数据筛选:
import pandas as pd
# 创建DataFrame
data = {
'name': ['Tom', 'Jerry', 'Mike'],
'age': [21, 22, 23],
'gender': ['male', 'male', 'female'],
'score': [90, 80, 85]
}
df = pd.DataFrame(data)
# 筛选score列大于等于85的数据
print(df[df['score'] >= 85])
上述代码中,使用了Boolean indexing筛选了score列大于等于85的数据。
总结
通过本文的讲解,我们了解了pandas中DataFrame的行列数据筛选的几种常用方法,包括loc、iloc、ix以及Boolean indexing等方法。这些方法帮助我们更加灵活和高效地处理DataFrame中的数据。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas系列之DataFrame 行列数据筛选实例 - Python技术站