关于Pandas count()与values_count()的用法及区别

yizhihongxing

关于Pandas count()与value_counts()的用法及区别

1. count()方法

count()方法用于计算DataFrame或Series中非缺失值的数量。其语法格式为:

DataFrame.count(axis=0, level=None, numeric_only=False)
Series.count()

其中,参数说明如下:

  • axis:0表示按列计算,1表示按行计算,可选,默认为0。
  • level:指定多重索引的级别,可选。
  • numeric_only:如果为True,则只统计数值类型的数据,可选,默认为False。

示例一:

import pandas as pd

data = {'name':['Tom', 'Lucy', 'Lily', 'Jane'],
        'age':[20, 19, 21, None],
        'gender':['M', 'F', 'F', None]}

df = pd.DataFrame(data)

print(df.count())

运行结果如下:

name      4
age       3
gender    3
dtype: int64

分析:该示例中,数据中有4个记录,但agegender列中各有一个缺失值,因此其计算非缺失值数量为3。

2. value_counts()方法

value_counts()方法用于计算Series中不同元素的出现次数。其语法格式为:

Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)

其中,参数说明如下:

  • normalize:如果为True,则返回每个元素出现的频率,可选,默认为False。
  • sort:如果为True,则按出现频率排序,可选,默认为True。
  • ascending:如果为False,则降序排列,可选,默认为False。
  • bins:用于离散化连续型数据。
  • dropna:如果为False,则不忽略缺失值。

示例二:

import pandas as pd

data = {'name':['Tom', 'Lucy', 'Lily', 'Jane', 'Lucy', 'Jane', 'Tom', 'Tom'],
        'age':[20, 19, 21, 19, 18, 20, 21, None],
        'gender':['M', 'F', 'F', 'F', 'M', None, 'M', 'M']}

df = pd.DataFrame(data)
s = df['name']

print(s.value_counts())

运行结果如下:

Tom     3
Lucy    2
Jane    2
Lily    1
Name: name, dtype: int64

分析:该示例中,统计了name列中的各个元素出现的次数,并按照次数从大到小排列。其中,Tom出现了3次,Lucy和Jane各出现了2次,Lily出现了1次。

3. count()和value_counts()方法的区别

  1. count()方法计算的是DataFrame或Series中非缺失值的数量,而value_counts()方法计算的是Series中不同元素出现的次数。

  2. count()方法适用于DataFrame或Series,而value_counts()方法仅适用于Series。

  3. count()方法的返回类型是整数,而value_counts()方法的返回类型是Series。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:关于Pandas count()与values_count()的用法及区别 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • MySQL存储Json字符串遇到的问题与解决方法

    MySQL存储Json字符串遇到的问题与解决方法 在进行开发时,我们通常会使用MySQL数据库存储数据。MySQL 5.7版本及以上版本支持存储Json字符串,但是在实际操作中会遇到一些问题和坑点。本文将详细讲解MySQL存储Json字符串遇到的问题以及解决方法。 问题 在MySQL中存储JSON字符串时,可能会遇到以下问题: 插入JSON字符串失败 SQL…

    python 2023年5月14日
    00
  • Python进行数据科学工作的简单入门教程

    Python进行数据科学工作的简单入门教程 简介 Python是一种非常流行的编程语言,因为它具有直观的语法和丰富的库。Python成为数据科学领域中的一种热门语言,因为有许多数据处理和分析工具可以帮助数据科学家进行数据探索,数据可视化和数据建模等任务。在本教程中,我们将介绍如何使用Python进行数据科学工作。 内容 安装Python和必备数据科学库 数据…

    python 2023年6月13日
    00
  • 在Pandas中使用查询方法进行复杂条件的选择

    在使用Pandas进行数据分析中,经常需要对数据进行筛选和选择操作。Pandas提供了比较灵活的查询方法,可以实现复杂条件的筛选和选择。本文将详细讲解在Pandas中如何使用查询方法进行复杂条件的选择。 DataFrame的查询方法 Pandas提供了两种查询方法,分别是query()和eval()方法。query()方法通常用于过滤数据,支持比较、逻辑和二…

    python-answer 2023年3月27日
    00
  • 在pandas中遍历DataFrame行的实现方法

    在Pandas中遍历DataFrame行的实现方法有以下几种: 使用iterrows(): 使用iterrows()能够返回DataFrame中的每一行,然后使用for循环遍历每一行,对每一行做需要的操作。以下是一个示例代码: import pandas as pd df = pd.read_csv(‘data.csv’) for index, row in…

    python 2023年5月14日
    00
  • 如何在一个DataFrame中绘制多个数据列

    在一个DataFrame中绘制多个数据列可以让我们更直观地比较不同数据之间的关系和趋势,这里提供一个完整的攻略。 1. 准备工作 首先,我们需要准备好数据,可以通过Pandas读取CSV、Excel等格式的数据。 以读取CSV文件为例,可以使用如下代码: import pandas as pd df = pd.read_csv(‘data.csv’) 其中,…

    python-answer 2023年3月27日
    00
  • 在Python中替换CSV文件的列值

    要替换CSV文件的列值,可以使用Python中的pandas库。pandas是一个强大的数据分析库,可以轻松处理和操作数据。 下面是一个示例代码,展示如何使用pandas读取CSV文件,替换指定列的某些值,然后将结果保存回CSV文件: import pandas as pd # 读取CSV文件 df = pd.read_csv(‘file.csv’) # 替…

    python-answer 2023年3月27日
    00
  • Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)

    下面我将详细讲解“Pandas对DataFrame单列/多列进行运算(map,apply,transform,agg)”的完整攻略,帮助你更好地理解Pandas中这些方法的使用。 1. apply方法 apply方法是对DataFrame单列运算的一种方法,它可以用于Series或者DataFrame的列上执行Python函数。apply方法的基本语法为: …

    python 2023年5月14日
    00
  • Python3数据库操作包pymysql的操作方法

    下面我来为大家讲解 Python3 数据库操作包 pymysql 的操作方法。 安装 PyMySQL 在开始使用 PyMySQL 之前,我们需要先根据 Python 版本安装 PyMySQL,可以通过 pip 命令来进行安装。 pip install PyMySQL 连接数据库 连接数据库需要使用 connect() 方法,并传入相应的参数。 import …

    python 2023年6月13日
    00
合作推广
合作推广
分享本页
返回顶部