Pandas聚合函数(Aggregation Function)是一种数据处理函数,用于对数据进行汇总、统计和分析。在数据分析中,常常需要对数据进行聚合计算,如计算平均值、总和、标准差、方差等。Pandas提供了多种聚合函数,可以方便地对数据进行统计和分析。
Pandas聚合函数可以应用于Series和DataFrame对象,可以对整个序列或数据框进行聚合,也可以对分组后的序列或数据框进行聚合。
Pandas聚合函数的一般形式为:
DataFrame.aggregate(func=None, axis=0, *args, **kwargs)
其中,func参数指定要应用的聚合函数或函数列表,axis参数指定应用聚合函数的轴方向(0表示按列,1表示按行)。
常见的Pandas聚合函数包括:
- mean():计算平均值
- sum():计算总和
- max():计算最大值
- min():计算最小值
- std():计算标准差
- var():计算方差
- count():计算非缺失值的数量
- describe():生成数据描述性统计信息
这些聚合函数可以结合groupby()函数一起使用,对分组后的数据进行聚合计算,以实现更灵活的数据分析和处理。
接下来将为你介绍Pandas常用的聚合函数。
mean()
mean()函数用于计算平均值,例如:
import pandas as pd
# 创建一个DataFrame对象
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10]
})
# 计算各列的平均值
mean_values = df.mean()
# 输出结果
print(mean_values)
输出结果为:
A 3.0
B 8.0
dtype: float64
sum()
sum()函数用于计算总和,例如:
import pandas as pd
# 创建一个DataFrame对象
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10]
})
# 计算各列的总和
sum_values = df.sum()
# 输出结果
print(sum_values)
输出结果为:
A 15
B 40
dtype: int64
max()
max()函数用于计算最大值,例如:
import pandas as pd
# 创建一个DataFrame对象
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10]
})
# 计算各列的最大值
max_values = df.max()
# 输出结果
print(max_values)
输出结果为:
A 5
B 10
dtype: int64
min()
min()函数用于计算最小值,例如:
import pandas as pd
# 创建一个DataFrame对象
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10]
})
# 计算各列的最小值
min_values = df.min()
# 输出结果
print(min_values)
输出结果为:
A 1
B 6
dtype: int64
std()
std()函数用于计算标准差,例如:
import pandas as pd
# 创建一个DataFrame对象
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10]
})
# 计算各列的标准差
std_values = df.std()
# 输出结果
print(std_values)
输出结果为:
A 1.581139
B 1.581139
dtype: float64
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas最常用的5种聚合函数 - Python技术站