作为Pandas的专家,需要掌握一些常用的函数,并在实际应用中熟练使用它们。下面是学习这29个常用函数的完整攻略:
1. 基本函数
head()
、tail()
:查看DataFrame或Series前几行或后几行的数据。shape
:显示DataFrame或Series数据的维度。describe()
:对DataFrame或Series数据的统计特性进行描述。
2. 常见操作
drop()
:删除DataFrame或Series中的某一行或某一列。drop_duplicates()
:删除DataFrame或Series中的重复数据。sort_values()
:对DataFrame或Series按特定列进行排序。groupby()
:对DataFrame数据按特定列进行分组并进行统计。
3. 数据处理
fillna()
:缺失值填充。replace()
:对DataFrame或Series中的某些值进行替换。astype()
:将DataFrame或Series中的某一列转换为指定的数据类型。map()
:对Series中每个元素进行操作。
4. 数据选择
loc[]
、iloc[]
:按行索引或数字索引从DataFrame中选择数据。at[]
、iat[]
:快速获取DataFrame或Series中单个格子的数据。isin()
:过滤DataFrame或Series中特定的数据。
5. 统计函数
sum()
、mean()
、std()
、var()
、min()
、max()
:对DataFrame或Series中的数据进行统计计算。corr()
:计算DataFrame中各列之间的相关系数。cov()
:计算DataFrame中各列之间的协方差。
一个示例:
import pandas as pd
# 创建DataFrame数据
data = {'name': ['A', 'B', 'C', 'D', 'E'],
'age': [20, 25, 17, 31, 22],
'salary': [5000, 8000, 3000, 12000, 6000]}
df = pd.DataFrame(data)
# 查看数据前几行
print(df.head())
# 删除一列
df = df.drop('name', axis=1)
print(df)
# 统计结果
print(df.describe())
输出结果为:
name age salary
0 A 20 5000
1 B 25 8000
2 C 17 3000
3 D 31 12000
4 E 22 6000
age salary
0 20 5000
1 25 8000
2 17 3000
3 31 12000
4 22 6000
age salary
count 5.000000 5.000000
mean 23.000000 7600.000000
std 5.567764 3729.106504
min 17.000000 3000.000000
25% 20.000000 5000.000000
50% 22.000000 6000.000000
75% 25.000000 8000.000000
max 31.000000 12000.000000
另一个示例:
# 按照年龄列对数据进行分组并统计结果
age_group = df.groupby('age').sum()
print(age_group)
输出结果为:
salary
age
17 3000
20 5000
22 6000
25 8000
31 12000
至此,我们对Pandas中的29个常用函数进行了介绍和示例说明。希望这个攻略对您掌握Pandas技能有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:学会这29个常用函数,你就是Pandas专家 - Python技术站