在 Pandas 数据框架中,我们可以使用 value_counts() 方法获取一个列的频率计数。下面是详细的攻略:
- 导入 Pandas 库
在使用 Pandas 的数据框架之前,我们需要导入 Pandas 库。
import pandas as pd
- 读取数据集
读取待处理的数据集,可以使用 Pandas 中的 read_csv() 方法。我们这里以示例数据集 titanic.csv 为例。
df = pd.read_csv('titanic.csv')
- 获取一个列的频率计数
使用 value_counts() 方法获取一个列的频率计数。
freq_counts = df['Embarked'].value_counts()
print(freq_counts)
上面的代码中,我们以 'Embarked' 列为例,使用 value_counts() 方法获取了该列的频率计数,并将结果存储在 freq_counts 变量中。然后使用 print() 函数打印了结果。在这个例子中,我们获取了 'Embarked' 列的频率计数,可以看到结果中包含有不同取值的频数,以及这些频数所对应的取值。
- 可选的参数
value_counts() 方法还可以接受一些可选的参数,来调整计数的方式。
- normalize:通过将频数除以总数得到频率,而不是简单的计数来计算值的相对频率。默认值为 False。
- sort:按照值的频数排序。默认值为 True。
- ascending:如果为 True,按照升序排列。如果为 False,按照降序排列。默认值为 False。
例如,我们可以按照降序排列,并将频数除以总数得到频率。
freq_counts = df['Embarked'].value_counts(normalize=True, sort=True, ascending=False)
print(freq_counts)
在这个例子中,我们使用了 normalize=True 将频数除以总数得到频率,并使用 sort=True, ascending=False 参数按照降序排列。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:在Pandas数据框架中获取一个列的频率计数 - Python技术站