pandas求平均数和中位数的方法实例

什么是平均数和中位数？

平均数是数值数据的总和除以数据点的数量，它可以很好地反映数据的总体趋势。中位数是数据样本中值的位置，即把样本数据按照大小排序，中间的数值即为中位数。在一些特殊情况下，使用中位数可以更好地描述数据集的分布情况，例如数据集中存在异常值时。

下面将会介绍pandas中如何使用内置的方法求取平均数和中位数。

使用pandas库求取平均数

示例1

下面的示例演示如何使用pandas库的mean()方法计算数据的平均数。在这个例子中，我们将使用pandas读取一个CSV文件中的数据并计算它的平均数。假设我们的CSV文件内容如下：

Name,Age,Salary
Tom,28,15000
John,30,20000
Lisa,32,25000
Jack,27,12000

代码：

import pandas as pd
data = pd.read_csv('test.csv')
mean_salary = data['Salary'].mean()
print('平均薪资为：', mean_salary)

结果：

平均薪资为： 18000.0

示例2

我们也可以通过指定行或列来计算该行或列的平均值。例如：

代码：

import pandas as pd
import numpy as np

data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
                    columns=['a', 'b', 'c'])

mean_a = data['a'].mean()
mean_b = data.loc[1].mean()
mean_c = data.iloc[:, 2].mean()

print(f'平均值 a: {mean_a}')
print(f'平均值 b: {mean_b}')
print(f'平均值 c: {mean_c}')

结果：

平均值 a: 4.0
平均值 b: 5.0
平均值 c: 6.0

使用pandas库求取中位数

示例1

和求平均值类似，我们同样可以使用pandas库的median()方法计算数据的中位数。在下面的示例中，我们将使用pandas读取一个CSV文件中的数据并计算该文件的中位数。假设我们的CSV文件内容如下：

Name,Age,Score
Tom,28,99
John,30,85
Lisa,32,78
Jack,27,92

代码：

import pandas as pd
data = pd.read_csv('test.csv')
median_score = data['Score'].median()
print('中位数为：', median_score)

结果：

中位数为： 88.5

示例2

我们也可以像计算平均值一样，指定行或列来计算该行或列的中位数。例如：

代码：

import pandas as pd
import numpy as np

data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
                    columns=['a', 'b', 'c'])

median_a = data['a'].median()
median_b = data.loc[1].median()
median_c = data.iloc[:, 2].median()

print(f'中位数 a: {median_a}')
print(f'中位数 b: {median_b}')
print(f'中位数 c: {median_c}')

结果：

中位数 a: 4.0
中位数 b: 5.0
中位数 c: 6.0

总结

pandas库的mean()和median()方法是很方便的统计数据集平均数和中位数的方法。通过指定行或列，我们可以统计该行或列的平均数或中位数。在数据分析和处理过程中，这些方法将会非常有用。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pandas求平均数和中位数的方法实例 - Python技术站

pandas求平均数和中位数的方法实例

pandas求平均数和中位数的方法实例

什么是平均数和中位数？

使用pandas库求取平均数

示例1

示例2

使用pandas库求取中位数

示例1

示例2

总结

相关文章