pandas数值计算与排序方法
一、数值计算
- 加(+)、减(-)、乘(*)、除(/)运算
Pandas 支持常见的数值计算运算符,可以对一维或多维 DataFrame/Series 数值进行计算。
例如,我们想要对两个 DataFrame 等大小的数据集进行加法计算:
import pandas as pd
# 创建两个数据集
df1 = pd.DataFrame({'a': [1,2,3], 'b':[4,5,6]})
df2 = pd.DataFrame({'a': [10,20,30], 'b':[40,50,60]})
# 数据集加法计算
result = df1 + df2
print(result)
运行结果:
a b
0 11 44
1 22 55
2 33 66
- 平均值、中位数、最小值、最大值等统计函数
Pandas 的 Series 和 DataFrame 类型都支持常用的统计函数,例如 mean()、median()、min()、max(),可以方便地对数据集进行统计。
例如,我们想要计算一个数据集的平均值、中位数、最小值、最大值:
import pandas as pd
# 创建一个数据集
df = pd.DataFrame({'a': [1,2,3], 'b':[4,5,6], 'c':[7,8,9]})
# 数据集统计函数计算
print('平均值', df.mean())
print('中位数', df.median())
print('最小值', df.min())
print('最大值', df.max())
运行结果:
平均值 a 2.0
b 5.0
c 8.0
dtype: float64
中位数 a 2.0
b 5.0
c 8.0
dtype: float64
最小值 a 1
b 4
c 7
dtype: int64
最大值 a 3
b 6
c 9
dtype: int64
二、排序方法
- Series 的排序
可以使用 sort_values() 方法对 Series 数据进行排序。
参数:
* ascending:默认为 True,升序排序。False则表示降序排序。
* inplace:默认为 False,不改变原有 Series 的排序结果。True 则表示修改原有 Series 的排序结果。
例如,我们想要对一个 Series 数据进行降序排序:
import pandas as pd
# 创建一个 Series 数据
data = pd.Series([3, 6, 1, 9, 8])
# Series 数据降序排序
data.sort_values(ascending=False, inplace=True)
print(data)
运行结果:
3 9
4 8
1 6
0 3
2 1
dtype: int64
- DataFrame 的排序
可以使用 sort_values() 方法对 DataFrame 数据进行排序。
参数:
* by:按照哪列进行排序,默认为第一列。
* ascending:默认为 True,升序排序。False则表示降序排序。
* inplace:默认为 False,不改变原有 DataFrame 的排序结果。True 则表示修改原有 DataFrame 的排序结果。
例如,我们想要对一个 DataFrame 数据集按照指定列进行降序排序:
import pandas as pd
# 创建一个 DataFrame 数据集
data = pd.DataFrame({'a': [1,5,2], 'b':[7,3,6], 'c':[8,6,4]})
# DataFrame 数据集按照指定列降序排序
data.sort_values(by='a', ascending=False, inplace=True)
print(data)
运行结果:
a b c
1 5 3 6
2 2 6 4
0 1 7 8
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas数值计算与排序方法 - Python技术站