pandas求平均数和中位数的方法实例

pandas求平均数和中位数的方法实例

什么是平均数和中位数?

平均数是数值数据的总和除以数据点的数量,它可以很好地反映数据的总体趋势。中位数是数据样本中值的位置,即把样本数据按照大小排序,中间的数值即为中位数。在一些特殊情况下,使用中位数可以更好地描述数据集的分布情况,例如数据集中存在异常值时。

下面将会介绍pandas中如何使用内置的方法求取平均数和中位数。

使用pandas库求取平均数

示例1

下面的示例演示如何使用pandas库的mean()方法计算数据的平均数。在这个例子中,我们将使用pandas读取一个CSV文件中的数据并计算它的平均数。假设我们的CSV文件内容如下:

Name,Age,Salary
Tom,28,15000
John,30,20000
Lisa,32,25000
Jack,27,12000

代码:

import pandas as pd
data = pd.read_csv('test.csv')
mean_salary = data['Salary'].mean()
print('平均薪资为:', mean_salary)

结果:

平均薪资为: 18000.0

示例2

我们也可以通过指定行或列来计算该行或列的平均值。例如:

代码:

import pandas as pd
import numpy as np

data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
                    columns=['a', 'b', 'c'])

mean_a = data['a'].mean()
mean_b = data.loc[1].mean()
mean_c = data.iloc[:, 2].mean()

print(f'平均值 a: {mean_a}')
print(f'平均值 b: {mean_b}')
print(f'平均值 c: {mean_c}')

结果:

平均值 a: 4.0
平均值 b: 5.0
平均值 c: 6.0

使用pandas库求取中位数

示例1

和求平均值类似,我们同样可以使用pandas库的median()方法计算数据的中位数。在下面的示例中,我们将使用pandas读取一个CSV文件中的数据并计算该文件的中位数。假设我们的CSV文件内容如下:

Name,Age,Score
Tom,28,99
John,30,85
Lisa,32,78
Jack,27,92

代码:

import pandas as pd
data = pd.read_csv('test.csv')
median_score = data['Score'].median()
print('中位数为:', median_score)

结果:

中位数为: 88.5

示例2

我们也可以像计算平均值一样,指定行或列来计算该行或列的中位数。例如:

代码:

import pandas as pd
import numpy as np

data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
                    columns=['a', 'b', 'c'])

median_a = data['a'].median()
median_b = data.loc[1].median()
median_c = data.iloc[:, 2].median()

print(f'中位数 a: {median_a}')
print(f'中位数 b: {median_b}')
print(f'中位数 c: {median_c}')

结果:

中位数 a: 4.0
中位数 b: 5.0
中位数 c: 6.0

总结

pandas库的mean()median()方法是很方便的统计数据集平均数和中位数的方法。通过指定行或列,我们可以统计该行或列的平均数或中位数。在数据分析和处理过程中,这些方法将会非常有用。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas求平均数和中位数的方法实例 - Python技术站

(2)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Python Pandas数据合并pd.merge用法详解

    下面是关于“Python Pandas数据合并pd.merge用法详解”的完整攻略: 1. pd.merge()函数的概述 pd.merge()函数是Pandas库中用于数据合并的重要函数之一,该函数主要用于根据一组或多组key将不同DataFrame中的行进行合并。该函数的基本语法如下: pd.merge(left, right, how=’inner’,…

    python 2023年5月14日
    00
  • Python pyecharts Line折线图的具体实现

    下面是Python pyecharts Line折线图的具体实现攻略: 简介 pyecharts 是一个基于 Echarts 实现的图表库,它支持很多种图表类型,包括柱状图、折线图、饼图、散点图等等。而 pyecharts 的优点在于简单易用,所需要的准备工作很少,只需要几行代码就可以生成一个漂亮的图表。 准备工作 在使用 pyecharts 之前,需要安装…

    python 2023年6月13日
    00
  • pandas数据选取:df[] df.loc[] df.iloc[] df.ix[] df.at[] df.iat[]

    Pandas是一种Python常用的数据处理工具,它具有很强的数据选取和处理能力,本文将详细讲解Pandas数据选取的完整攻略。 一、pandas数据选取方法 Pandas提供了丰富的数据选取方法,常用的包括: df[]:基于列名或索引选取列或行; df.loc[]:基于行和列名称选取数据; df.iloc[]:通过整数位置选取数据; df.ix[]:基于行…

    python 2023年5月14日
    00
  • Python Pandas.factorize()

    让我们来详细讲解Python Pandas.factorize()方法的完整攻略。 一、Pandas.factorize()方法介绍 Pandas.factorize()方法用于将一列中的离散型数据转换成连续的数值型数据。它返回一个元组,包含两个数组,第一个数组是每个唯一值的编码,第二个数组是唯一的、有序的值。 二、Pandas.factorize()方法使…

    python-answer 2023年3月27日
    00
  • 查找给定的Pandas数据框架的几何平均数

    要查找给定的 Pandas 数据框架的几何平均数,可以通过下面的步骤实现: 导入 pandas 和 numpy 库。 import pandas as pd import numpy as np 创建一个示例数据框架。 df = pd.DataFrame({ ‘A’: [1, 2, 3, 4, 5], ‘B’: [6, 7, 8, 9, 10], ‘C’: …

    python-answer 2023年3月27日
    00
  • 连接Pandas数据帧,无重复的数据帧

    连接Pandas数据帧和处理无重复数据帧是使用Pandas进行数据处理的常见任务之一。下面是一个完整的攻略,涵盖了连接不同数据帧,删除复制数据等方面。 连接Pandas数据帧 连接Pandas数据帧通常使用以下三个方法: Concatenate(串联) concatenate方法可以将两个或多个数据帧按行或列进行连接。 行连接 concatenate方法的默…

    python-answer 2023年3月27日
    00
  • Python运用于数据分析的简单教程

    Python运用于数据分析的简单教程 数据分析是如今越来越重要的一个领域,同时Python也成为数据分析的热门工具之一。在本教程中,我们将向您介绍如何使用Python进行数据分析的基础知识和操作过程。 安装Python和必要的包 首先,您需要安装Python以及与数据分析相关的各种包。以下是基本的安装步骤: 下载并安装 Python 安装 NumPy pip…

    python 2023年5月14日
    00
  • 如何在Python中把一个列表转换为一个DataFrame行

    将一个列表转换为一个DataFrame行分为以下几个步骤: 导入必要的库 在Python中,我们需要使用pandas库来处理DataFrame。因此,首先需要导入pandas库,代码如下: pythonimport pandas as pd 创建列表 为了将列表转换为DataFrame行,我们需要先创建一个列表。例如,我们创建以下列表: pythonmy_l…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部