Dataframe列运算
在数据处理中经常需要对Dataframe列进行运算,比如对列求和、求平均数等。Pandas提供了方便的方法来执行这些列运算,本文将介绍一些最常用的方法。
创建样本数据
在介绍具体方法之前,先创建一个样本数据,供我们演示使用。
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0,10,size=(5, 3)), columns=['A', 'B', 'C'])
这段代码将创建一个3列、5行,元素在0到10之间的随机数的Dataframe。
下面将介绍5种常见的列运算方法。
求和
使用Dataframe的sum()
方法可以对一列数据求和。
df['A'].sum()
这段代码将会对A列求和。
如果要对所有列求和,可以使用sum()
函数。
df.sum()
这段代码将会对所有列求和。
平均数
使用Dataframe的mean()
方法可以对一列数据求平均数。
df['A'].mean()
这段代码将会对A列求平均数。
如果要对所有列求平均数,可以使用mean()
函数。
df.mean()
这段代码将会对所有列求平均数。
最大值
使用Dataframe的max()
方法可以对一列数据求最大值。
df['A'].max()
这段代码将会对A列求最大值。
如果要对所有列求最大值,可以使用max()
函数。
df.max()
这段代码将会对所有列求最大值。
最小值
使用Dataframe的min()
方法可以对一列数据求最小值。
df['A'].min()
这段代码将会对A列求最小值。
如果要对所有列求最小值,可以使用min()
函数。
df.min()
这段代码将会对所有列求最小值。
统计信息
使用Dataframe的describe()
方法可以对一列数据进行统计,并输出基本统计信息。输出结果包括“count(数据个数)”、“mean(平均数)”、“std(标准差)”、“min(最小值)”、“25%”、“50%”、“75%”、“max(最大值)”。
df['A'].describe()
这段代码将会输出A列的基本统计信息。
如果要对所有列进行统计,可以使用describe()
函数。
df.describe()
这段代码将会输出所有列的基本统计信息。
以上就是常见的Dataframe列运算方法,可以根据需要选择相应的方法进行操作。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:dataframe列运算 - Python技术站