PythonPandas常用函数方法总结
什么是Python Pandas库?
Pandas是Python中的一个数据处理库,它提供了数据处理和分析的实用工具,使得数据处理更加快速和容易。Pandas主要包含两个核心数据结构:Series和DataFrame。Series用于处理单一纬度的数据,而DataFrame用于处理多维数据的表格。
Pandas常用函数
1. DataFrame的创建
DataFrame是Pandas库最常用的数据结构之一,用于处理表格型数据。DataFrame的创建方式有很多,下面是一些常用的方式。
通过字典创建DataFrame
import pandas as pd
data = {'name': ['Jack', 'Tom', 'Mary', 'Ben'],
'age': [18, 23, 21, 19],
'score': [85, 92, 77, 81]}
df = pd.DataFrame(data)
print(df)
上述代码通过一个字典来创建DataFrame。其中字典的键是列名,键的值是列中的数据。
通过列表创建DataFrame
import pandas as pd
data = [['Jack', 18, 85], ['Tom', 23, 92], ['Mary', 21, 77], ['Ben', 19, 81]]
df = pd.DataFrame(data, columns=['name', 'age', 'score'])
print(df)
上述代码通过一个列表中的列表来创建DataFrame。列表中的每个子列表表示DataFrame中的一行数据,子列表中的元素依次是每列的值。可以通过columns
参数来指定列名。
2. DataFrame基本操作
选取列数据
import pandas as pd
data = {'name': ['Jack', 'Tom', 'Mary', 'Ben'],
'age': [18, 23, 21, 19],
'score': [85, 92, 77, 81]}
df = pd.DataFrame(data)
print(df['name'])
上述代码可以选取列名为name
的列数据。选取列数据的方式有两种,一种是使用中括号来访问,另一种是使用点号来访问。
选取行数据
import pandas as pd
data = {'name': ['Jack', 'Tom', 'Mary', 'Ben'],
'age': [18, 23, 21, 19],
'score': [85, 92, 77, 81]}
df = pd.DataFrame(data)
print(df.loc[0])
上述代码可以选取第一行的数据。选取行数据使用的是loc
方法,可以通过loc
方法来选取行索引或列索引。
3. 数据清洗
在数据分析的过程中,清洗数据是必要的步骤之一。Pandas提供了很多清洗数据的函数和方法,下面是一些常用的函数和方法。
剔除缺失值
import pandas as pd
data = {'name': ['Jack', 'Tom', 'Mary', 'Ben'],
'age': [18, None, 21, 19],
'score': [85, 92, None, 81]}
df = pd.DataFrame(data)
print(df.dropna())
上述代码通过dropna
方法剔除了包含缺失值的行。dropna
方法可以删除含有任何缺失值的行或列。
填充缺失值
import pandas as pd
data = {'name': ['Jack', 'Tom', 'Mary', 'Ben'],
'age': [18, None, 21, 19],
'score': [85, 92, None, 81]}
df = pd.DataFrame(data)
print(df.fillna(0))
上述代码通过fillna
方法填充了缺失的数据。fillna
方法可以将DataFrame中NaN值替换为指定的值。
总结
本文总结了Pandas库的一些常用函数和方法,包括DataFrame的创建、基本操作和数据清洗等。Pandas是一个功能强大的数据处理库,掌握它的基础用法对于数据分析和处理非常有帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python Pandas常用函数方法总结 - Python技术站