获取Pandas数据框架中某一列的唯一值的过程基本上分为以下三个步骤:
- 选取数据框架中的某一列
- 对该列进行去重操作
- 取得去重后的唯一值
下面以一个实例进行详细说明。
假设我们有这样一个数据框架:
name age city
0 Tom 10 NYC
1 Lucy 15 LAX
2 Ting 10 NYC
3 John 22 Tokyo
4 Mary 24 Paris
5 Ben 22 Tokyo
我们希望从city
这一列中获取唯一值,那么按照上述三个步骤,可以在Jupyter Notebook中执行以下代码:
import pandas
# 构造数据框架
data = {'name': ['Tom', 'Lucy', 'Ting', 'John', 'Mary', 'Ben'],
'age': [10, 15, 10, 22, 24, 22],
'city': ['NYC', 'LAX', 'NYC', 'Tokyo', 'Paris', 'Tokyo']}
df = pandas.DataFrame(data)
# 获取city这一列
city_column = df['city']
# 对city这一列进行去重操作
unique_city = city_column.drop_duplicates()
# 输出结果
print(unique_city)
运行结果为:
0 NYC
1 LAX
3 Tokyo
4 Paris
Name: city, dtype: object
以上代码中,我们首先使用字典构造器和Pandas的DataFrame
函数构造了一个数据框架,然后选取了city
这一列,接着使用drop_duplicates
方法对这一列进行去重操作,最终得到了去重后的唯一值。需要注意的是,drop_duplicates
方法生成了一个新的Series,对原数据框架没有修改,如果想对数据框架进行修改,请使用inplace=True
参数。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:从Pandas数据框架的某一列中获取唯一值 - Python技术站