pandas求平均数和中位数的方法实例

pandas求平均数和中位数的方法实例

什么是平均数和中位数?

平均数是数值数据的总和除以数据点的数量,它可以很好地反映数据的总体趋势。中位数是数据样本中值的位置,即把样本数据按照大小排序,中间的数值即为中位数。在一些特殊情况下,使用中位数可以更好地描述数据集的分布情况,例如数据集中存在异常值时。

下面将会介绍pandas中如何使用内置的方法求取平均数和中位数。

使用pandas库求取平均数

示例1

下面的示例演示如何使用pandas库的mean()方法计算数据的平均数。在这个例子中,我们将使用pandas读取一个CSV文件中的数据并计算它的平均数。假设我们的CSV文件内容如下:

Name,Age,Salary
Tom,28,15000
John,30,20000
Lisa,32,25000
Jack,27,12000

代码:

import pandas as pd
data = pd.read_csv('test.csv')
mean_salary = data['Salary'].mean()
print('平均薪资为:', mean_salary)

结果:

平均薪资为: 18000.0

示例2

我们也可以通过指定行或列来计算该行或列的平均值。例如:

代码:

import pandas as pd
import numpy as np

data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
                    columns=['a', 'b', 'c'])

mean_a = data['a'].mean()
mean_b = data.loc[1].mean()
mean_c = data.iloc[:, 2].mean()

print(f'平均值 a: {mean_a}')
print(f'平均值 b: {mean_b}')
print(f'平均值 c: {mean_c}')

结果:

平均值 a: 4.0
平均值 b: 5.0
平均值 c: 6.0

使用pandas库求取中位数

示例1

和求平均值类似,我们同样可以使用pandas库的median()方法计算数据的中位数。在下面的示例中,我们将使用pandas读取一个CSV文件中的数据并计算该文件的中位数。假设我们的CSV文件内容如下:

Name,Age,Score
Tom,28,99
John,30,85
Lisa,32,78
Jack,27,92

代码:

import pandas as pd
data = pd.read_csv('test.csv')
median_score = data['Score'].median()
print('中位数为:', median_score)

结果:

中位数为: 88.5

示例2

我们也可以像计算平均值一样,指定行或列来计算该行或列的中位数。例如:

代码:

import pandas as pd
import numpy as np

data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
                    columns=['a', 'b', 'c'])

median_a = data['a'].median()
median_b = data.loc[1].median()
median_c = data.iloc[:, 2].median()

print(f'中位数 a: {median_a}')
print(f'中位数 b: {median_b}')
print(f'中位数 c: {median_c}')

结果:

中位数 a: 4.0
中位数 b: 5.0
中位数 c: 6.0

总结

pandas库的mean()median()方法是很方便的统计数据集平均数和中位数的方法。通过指定行或列,我们可以统计该行或列的平均数或中位数。在数据分析和处理过程中,这些方法将会非常有用。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas求平均数和中位数的方法实例 - Python技术站

(2)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • pandas分批读取大数据集教程

    下面是“pandas分批读取大数据集教程”的完整攻略: 1. 背景介绍 当我们需要处理较大的数据集时,直接将整个数据集读入内存中会导致程序崩溃或内存溢出。为了解决这个问题,我们需要分批读取数据集,将其分割成若干个小批次进行处理。pandas提供了多种方法实现分批读取大数据集,下面介绍其中两种。 2. 实现方法 2.1 方法一:使用chunksize参数 pa…

    python 2023年5月14日
    00
  • 用Pandas Groupby模块创建非层次化的列

    Pandas是Python语言中经常使用的数据处理库,其中Groupby模块用于对数据集进行分组操作,可以通过Groupby模块创建非层次化的列来更好地呈现数据,以下是详细讲解: 1.导入Pandas模块 在使用Pandas Groupby模块之前,需要先导入相关模块,可通过以下方式进行导入: import pandas as pd 2.创建数据集 在对数据…

    python-answer 2023年3月27日
    00
  • Python的Pandas时序数据详解

    Python的Pandas时序数据详解 在数据分析和数据挖掘任务中,时序数据的常见任务包括数据整理、分析、可视化等。这些任务可以通过Python的Pandas库进行实现。Python的Pandas库是一个基于NumPy的数据分析工具,可以处理各种数据类型,包括时序数据。 本文将详细介绍如何使用Python的Pandas库来处理时序数据,包括数据加载、数据清洗…

    python 2023年5月14日
    00
  • python绘制箱型图

    下面是Python绘制箱型图的完整攻略: 一、简介 箱型图(Box plot)是一种用来展示一个数据集分散情况的统计图表。它主要用来展示多个数据集之间的比较,其中包括了最大值、最小值、中位数和四分位数(上四分位数和下四分位数)。箱型图的绘制依赖于matplotlib库。 二、箱型图的使用 1. 导入库 绘制箱型图前,需要导入numpy和matplotlib库…

    python 2023年6月13日
    00
  • Python如何设置指定窗口为前台活动窗口

    当我们在使用Python编写桌面应用程序时,有时候需要将指定窗口设为前台窗口,即将其移到屏幕前面并激活。Python提供了win32gui库可以实现操作Windows系统的窗口,下面是设置指定窗口为前台应用窗口的攻略: 1. 导入win32gui库 在Python脚本中,可以先导入win32gui库,示例如下: import win32gui 2. 获取窗口…

    python 2023年5月14日
    00
  • Pandas – 对数据框架进行Groupby值计数

    Pandas是一种强大的数据处理库,可以用来处理大量数据。Groupby是一种强大的聚合函数,可以将数据分组并对每个分组进行某些操作。在这里,我们将使用Pandas的Groupby函数来对数据框架进行值计数,以便更好地理解如何使用它。下面是详细的攻略过程,包括实际示例: 什么是Groupby? Groupby是一种将数据分组并将每个分组作为一个单独的实体进行…

    python-answer 2023年3月27日
    00
  • Pandas Shift函数的基础入门学习笔记

    PandasShift函数是Pandas库中的一个用于数据移动和位移的函数,它可以实现数据的平移和滚动计算等操作。下面是使用PandasShift函数的基础入门学习笔记的完整攻略。 基本语法 PandasShift函数的基本语法如下: DataFrame.shift(periods=1, freq=None, axis=0, fill_value=None)…

    python 2023年5月14日
    00
  • Pandas使用stack和pivot实现数据透视的方法

    当我们需要进行数据聚合和分析的时候,数据透视是非常重要的方法之一。在Python语言中,Pandas库提供了两个非常重要的方法stack和pivot,来帮助我们轻松实现数据透视。接下来,我们将会详细讲解如何使用这两个方法来实现数据透视。 1. stack方法 stack()方法可以将DataFrame中的列转换成行,返回一个新的Series或DataFram…

    python 2023年6月13日
    00
合作推广
合作推广
分享本页
返回顶部