为了统计 Python 数据集中标签的类别及数目,我们需要进行以下步骤:
步骤一:读取数据
要统计数据集中标签的类别及数目,我们需要先读取数据,使用Python的pandas库可以实现快速读取数据集。
import pandas as pd
data = pd.read_csv("data.csv")
上述代码将读取名为 "data.csv" 的数据文件,并将其存储在名为 "data" 的变量中。
步骤二:统计标签类别及数目
接下来,我们需要统计数据集中不同标签类别的出现次数。为此,我们可以使用Python的pandas库中的value_counts()函数。
labels_count = data['label'].value_counts()
上述代码将统计数据集中 "label" 列中每个唯一值出现的次数,并将结果存储在名为 "labels_count" 的变量中。
步骤三:展示统计结果
最后,我们需要将统计结果展示出来。我们可以使用Python的print语句将labels_count输出出来。
print(labels_count)
示例1:
如果你的数据集中包含以下标签:
- A
- A
- B
- C
- C
- C
则经过以上步骤,输出的结果将会是:
C 3
A 2
B 1
Name: label, dtype: int64
说明数据集中共有3种不同的标签类型:A、B和C。其中C出现了3次,A出现了2次,B出现了1次。
示例2:
如果你的数据集中包含以下标签:
- positive
- positive
- positive
- negative
- neutral
- neutral
则经过以上步骤,输出的结果将会是:
positive 3
neutral 2
negative 1
Name: label, dtype: int64
说明数据集中共有3种不同的标签类型:positive、neutral和negative。其中positive出现了3次,neutral出现了2次,negative出现了1次。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python 统计数据集标签的类别及数目操作 - Python技术站