Python基础篇之Pandas常用基本函数汇总
1. 背景介绍
Pandas
是一种开放源代码的数据分析和处理工具,它被广泛应用于数据科学领域。在Pandas
中,有许多常用的基本函数,本文将总结这些函数并提供示例演示。
2. 常用基本函数
以下是Pandas
中常用的基本函数:
2.1 读取数据
-
read_csv()
:读取csv文件数据并转换成DataFrame格式。示例:data = pd.read_csv('data.csv')
-
read_excel()
:读取Excel文件数据并转换成DataFrame格式。示例:data = pd.read_excel('data.xlsx')
2.2 数据清洗
-
dropna()
:删除包含空值的行或列。示例:data.dropna()
-
fillna()
:将空值填充为其他值。示例:data.fillna(0)
-
replace()
:替换某个值为其他值。示例:data.replace('a', 'b')
2.3 数据处理
-
describe()
:统计数据的基本统计量,如均值、标准差、最小值、最大值等。示例:data.describe()
-
corr()
:计算DataFrame中两两列之间的相关系数。示例:data.corr()
-
groupby()
:分组统计某些列的信息。示例:data.groupby(['column1', 'column2'])['column3'].sum()
2.4 数据输出
-
to_csv()
:将DataFrame中的数据输出为csv文件。示例:data.to_csv('output.csv')
-
to_excel()
:将DataFrame中的数据输出为Excel文件。示例:data.to_excel('output.xlsx')
3. 示例说明
3.1 示例1
假设我们有一个包含学生成绩信息的csv文件student.csv
,其中字段包括姓名、科目、成绩等等。我们可以使用read_csv()
函数将其读取进来:
import pandas as pd
data = pd.read_csv('student.csv')
接下来,我们可以使用dropna()
函数删除空值的行:
data = data.dropna()
然后,我们可以使用describe()
函数计算DataFrame数据的基本统计量:
print(data.describe())
3.2 示例2
假设我们有一个包含股票数据的csv文件stock.csv
,其中字段包括日期、股票代码、收盘价等等。我们可以使用read_csv()
函数将其读取进来:
import pandas as pd
data = pd.read_csv('stock.csv')
接下来,我们可以使用groupby()
函数统计每个股票代码的总收盘价:
result = data.groupby(['股票代码'])['收盘价'].sum()
print(result)
最后,我们可以使用to_csv()
函数将结果输出到文件中:
result.to_csv('result.csv')
4. 总结
Pandas
是一种非常强大的数据分析和处理工具,它提供了非常丰富的基本函数。本文总结了Pandas
中常用的基本函数,并提供了示例说明,希望对大家的学习和应用有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python基础篇之pandas常用基本函数汇总 - Python技术站