pandas求平均数和中位数的方法实例
什么是平均数和中位数?
平均数是数值数据的总和除以数据点的数量,它可以很好地反映数据的总体趋势。中位数是数据样本中值的位置,即把样本数据按照大小排序,中间的数值即为中位数。在一些特殊情况下,使用中位数可以更好地描述数据集的分布情况,例如数据集中存在异常值时。
下面将会介绍pandas中如何使用内置的方法求取平均数和中位数。
使用pandas库求取平均数
示例1
下面的示例演示如何使用pandas库的mean()
方法计算数据的平均数。在这个例子中,我们将使用pandas读取一个CSV文件中的数据并计算它的平均数。假设我们的CSV文件内容如下:
Name,Age,Salary
Tom,28,15000
John,30,20000
Lisa,32,25000
Jack,27,12000
代码:
import pandas as pd
data = pd.read_csv('test.csv')
mean_salary = data['Salary'].mean()
print('平均薪资为:', mean_salary)
结果:
平均薪资为: 18000.0
示例2
我们也可以通过指定行或列来计算该行或列的平均值。例如:
代码:
import pandas as pd
import numpy as np
data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
columns=['a', 'b', 'c'])
mean_a = data['a'].mean()
mean_b = data.loc[1].mean()
mean_c = data.iloc[:, 2].mean()
print(f'平均值 a: {mean_a}')
print(f'平均值 b: {mean_b}')
print(f'平均值 c: {mean_c}')
结果:
平均值 a: 4.0
平均值 b: 5.0
平均值 c: 6.0
使用pandas库求取中位数
示例1
和求平均值类似,我们同样可以使用pandas库的median()
方法计算数据的中位数。在下面的示例中,我们将使用pandas读取一个CSV文件中的数据并计算该文件的中位数。假设我们的CSV文件内容如下:
Name,Age,Score
Tom,28,99
John,30,85
Lisa,32,78
Jack,27,92
代码:
import pandas as pd
data = pd.read_csv('test.csv')
median_score = data['Score'].median()
print('中位数为:', median_score)
结果:
中位数为: 88.5
示例2
我们也可以像计算平均值一样,指定行或列来计算该行或列的中位数。例如:
代码:
import pandas as pd
import numpy as np
data = pd.DataFrame(np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]),
columns=['a', 'b', 'c'])
median_a = data['a'].median()
median_b = data.loc[1].median()
median_c = data.iloc[:, 2].median()
print(f'中位数 a: {median_a}')
print(f'中位数 b: {median_b}')
print(f'中位数 c: {median_c}')
结果:
中位数 a: 4.0
中位数 b: 5.0
中位数 c: 6.0
总结
pandas库的mean()
和median()
方法是很方便的统计数据集平均数和中位数的方法。通过指定行或列,我们可以统计该行或列的平均数或中位数。在数据分析和处理过程中,这些方法将会非常有用。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas求平均数和中位数的方法实例 - Python技术站