我们可以使用Pandas函数 value_counts()
来计算一列数据中每个数值出现的次数,同时返回每个数值和它的计数值,这个计数值就是指每个数值在该列出现的次数。下面是一个示例代码:
import pandas as pd
data = pd.read_csv('file.csv')
value_counts_result = data['column_name'].value_counts()
print(value_counts_result)
这里我们使用了 read_csv()
函数从 CSV 文件中读取数据,然后使用 value_counts()
函数计算每个数值出现的次数。我们可以在这个结果中找到每个数值和它的计数值。
我们可以通过以下代码将结果分别存储为两个列表:
import pandas as pd
data = pd.read_csv('file.csv')
value_counts_result = data['column_name'].value_counts()
value_list = value_counts_result.index.tolist()
count_list = value_counts_result.tolist()
print(value_list)
print(count_list)
value_counts()
函数返回的结果以 Series(系列) 的形式表示,其中包括数值和它的计数值。这个 Series 对象拥有叫做 index
的属性,包含了每个不同数值,我们可以使用 index.tolist()
获取所有数值。而每个数值出现的计数值则是 Series 对象中的数值部分,我们可以通过 tolist()
函数将其转换为一个列表对象。
值得一提的是,如果我们想把这个结果存储到另一个 DataFrame 对象中,可以使用以下代码:
import pandas as pd
data = pd.read_csv('file.csv')
value_counts_result = data['column_name'].value_counts()
result_df = pd.DataFrame({'value': value_counts_result.index.tolist(), 'count': value_counts_result.tolist()})
print(result_df)
上述代码中,我们先将列表转换成一个字典对象,然后使用 pd.DataFrame()
函数将其转换为一个 DataFrame 对象,其中字典的 keys 分别为 'value' 和 'count'。这样做的好处是可以将结果存储到一个 DataFrame 中方便进行后续的操作。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:如何从Pandas的value_counts()中提取数值名称和计数 - Python技术站