当使用Python中的pandas库进行数据处理时,经常需要对数据进行统计计算,这时可以使用agg函数来实现。agg函数可以对DataFrame类型的数据进行聚合操作,聚合的方式包括平均值、中位数、和、标准差等。下面将对agg函数的用法进行详细讲解。
pandas中的agg函数用法
函数定义
agg函数的定义为:
DataFrame.agg func, axis=0, *args, **kwargs
其中,DataFrame是需要聚合的数据,func是需要使用的聚合函数。
常用的聚合函数
在使用agg函数时,我们需要指定一个或多个聚合函数。下面列举了一些常用的聚合函数和其使用方法:
- mean:计算均值。示例代码:
data = {'Company':['A', 'A', 'B', 'B'], 'Sales':[200, 250, 300, 150]}
df = pd.DataFrame(data)
df.agg({'Sales':'mean'})
上述代码中,我们统计了每个公司的销售额均值。
- median:计算中位数。示例代码:
data = {'Company':['A', 'A', 'B', 'B'], 'Sales':[200, 250, 300, 150]}
df = pd.DataFrame(data)
df.agg({'Sales':'median'})
上述代码中,我们统计了每个公司的销售额中位数。
- sum:计算和。示例代码:
data = {'Company':['A', 'A', 'B', 'B'], 'Sales':[200, 250, 300, 150]}
df = pd.DataFrame(data)
df.agg({'Sales':'sum'})
上述代码中,我们统计了每个公司的销售额总和。
- std:计算标准差。示例代码:
data = {'Company':['A', 'A', 'B', 'B'], 'Sales':[200, 250, 300, 150]}
df = pd.DataFrame(data)
df.agg({'Sales':'std'})
上述代码中,我们统计了每个公司的销售额标准差。
聚合多个列
agg函数也可以用于聚合多个列的数据。示例代码:
data = {'Company':['A', 'A', 'B', 'B'], 'Sales':[200, 250, 300, 150], 'Profit':[20, 25, 30, 15]}
df = pd.DataFrame(data)
df.agg({'Sales':['mean', 'sum'], 'Profit':['median', 'std']})
上述代码中,我们统计了每个公司的销售额均值、总和;利润的中位数和标准差。
结语
以上就是pandas中agg函数的详细用法介绍,我们可以灵活运用agg函数进行数据聚合操作,加快数据处理速度,并获得更好的数据分析效果。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python pandas中的agg函数用法 - Python技术站