计算Pandas数据框中某一列的不同值,可以使用Pandas库中的nunique()函数。nunique()函数会针对指定的列返回该列中不同元素的数量。
具体操作步骤如下:
- 导入Pandas库
import pandas as pd
- 创建数据框
为了说明,我们这里创建一个名为df的数据框,包含3列数据。
df = pd.DataFrame({'name': ['Tom', 'Jerry', 'Tom', 'Mike'],
'gender': ['male', 'male', 'female', 'male'],
'age': [25, 28, 23, 27]})
print(df)
输出:
name gender age
0 Tom male 25
1 Jerry male 28
2 Tom female 23
3 Mike male 27
- 计算某一列的不同值数量
通过传入列名,nunique()函数可以获取该列中不同元素的数量。例如计算name列的不同值数量:
name_unique_num = df['name'].nunique()
print(name_unique_num)
输出:
3
其中,name列中的不同值有:Tom、Jerry、Mike,总共3个不同值。
完整计算某一列的不同值数量的代码如下:
import pandas as pd
df = pd.DataFrame({'name' : ['Tom', 'Jerry', 'Tom', 'Mike'],
'gender': ['male', 'male', 'female', 'male'],
'age' : [25, 28, 23, 27]})
# 计算不同值数量
name_unique_num = df['name'].nunique()
gender_unique_num = df['gender'].nunique()
age_unique_num = df['age'].nunique()
print('不同名字数量:', name_unique_num)
print('不同性别数量:', gender_unique_num)
print('不同年龄数量:', age_unique_num)
输出:
不同名字数量: 3
不同性别数量: 2
不同年龄数量: 4
其中,name列中有3个不同的名字,gender列中有2个不同的性别,age列中有4个不同的年龄。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何计算Pandas数据框架列的不同值 - Python技术站