pandas数值计算与排序方法

一、数值计算

加（+）、减（-）、乘（*）、除（/）运算

Pandas 支持常见的数值计算运算符，可以对一维或多维 DataFrame/Series 数值进行计算。

例如，我们想要对两个 DataFrame 等大小的数据集进行加法计算：

import pandas as pd

# 创建两个数据集
df1 = pd.DataFrame({'a': [1,2,3], 'b':[4,5,6]})
df2 = pd.DataFrame({'a': [10,20,30], 'b':[40,50,60]})

# 数据集加法计算
result = df1 + df2
print(result)

运行结果：

平均值、中位数、最小值、最大值等统计函数

Pandas 的 Series 和 DataFrame 类型都支持常用的统计函数，例如 mean()、median()、min()、max()，可以方便地对数据集进行统计。

例如，我们想要计算一个数据集的平均值、中位数、最小值、最大值：

import pandas as pd

# 创建一个数据集
df = pd.DataFrame({'a': [1,2,3], 'b':[4,5,6], 'c':[7,8,9]})

# 数据集统计函数计算
print('平均值', df.mean())
print('中位数', df.median())
print('最小值', df.min())
print('最大值', df.max())

运行结果：

平均值 a 2.0
b 5.0
c 8.0
dtype: float64

中位数 a 2.0
b 5.0
c 8.0
dtype: float64

最小值 a 1
b 4
c 7
dtype: int64

最大值 a 3
b 6
c 9
dtype: int64

二、排序方法

Series 的排序

可以使用 sort_values() 方法对 Series 数据进行排序。

参数：
* ascending：默认为 True，升序排序。False则表示降序排序。
* inplace：默认为 False，不改变原有 Series 的排序结果。True 则表示修改原有 Series 的排序结果。

例如，我们想要对一个 Series 数据进行降序排序：

import pandas as pd

# 创建一个 Series 数据
data = pd.Series([3, 6, 1, 9, 8])

# Series 数据降序排序
data.sort_values(ascending=False, inplace=True)
print(data)

运行结果：

3    9
4    8
1    6
0    3
2    1
dtype: int64

DataFrame 的排序

可以使用 sort_values() 方法对 DataFrame 数据进行排序。

参数：
* by：按照哪列进行排序，默认为第一列。
* ascending：默认为 True，升序排序。False则表示降序排序。
* inplace：默认为 False，不改变原有 DataFrame 的排序结果。True 则表示修改原有 DataFrame 的排序结果。

例如，我们想要对一个 DataFrame 数据集按照指定列进行降序排序：

import pandas as pd

# 创建一个 DataFrame 数据集
data = pd.DataFrame({'a': [1,5,2], 'b':[7,3,6], 'c':[8,6,4]})

# DataFrame 数据集按照指定列降序排序
data.sort_values(by='a', ascending=False, inplace=True)
print(data)

运行结果：

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：pandas数值计算与排序方法 - Python技术站

pandas数值计算与排序方法