Pandas:DataFrame对象的基础操作方法

Pandas是Python中最受欢迎的数据分析工具之一，提供了各种各样处理结构化数据的功能。其中，DataFrame是最为常见的数据结构之一，类似于Excel中的表格，常用于处理二维数组，但是也可以用于处理多维数组。

以下是Pandas中DataFrame对象的基础操作方法的完整攻略:

创建DataFrame对象

要使用DataFrame最基本的操作是创建它。Pandas提供了许多方法来创建DataFrame。其中，一个常见的方法是使用字典(dict)来创建一个DataFrame：

import pandas as pd

data = {'Country': ['China', 'India', 'United States', 'Indonesia', 'Pakistan', 'Brazil', 'Nigeria', 'Bangladesh', 'Russia', 'Mexico'],
       'Population': [1393.8, 1366.4, 329.9, 269.6, 220.8, 211.8, 206.1, 168.7, 146.8, 126.6],
       'GDP': [14342.9, 2597.5, 21427.3, 1015.4, 278.2, 2064.5, 410.7, 275.4, 1715.3, 1211.4]}

df = pd.DataFrame(data)
print(df)

上述代码创建了一个DataFrame对象，该DataFrame包含了每个国家的名称、人口和GDP。使用print(df)命令来查看DataFrame的内容。

读取CSV文件来创建DataFrame对象

通常，数据都以CSV(逗号分隔)文件格式存储。使用Pandas，可以轻松地读取CSV文件并将其转换为DataFrame对象。

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head())

上述代码使用read_csv()方法读取"data.csv"文件，然后使用head()方法打印前5条记录。

访问DataFrame数据

使用DataFrame对象，可以轻松地访问它所包含的数据。可以使用列/行名称或列/行号来访问DataFrame。

import pandas as pd

df = pd.read_csv('data.csv')
print(df['Country'])   # 访问Country列数据
print(df.iloc[2])      # 访问第3行数据

上述代码中，我们使用列名称Country和.iloc方法分别访问Country列和第3行数据。

修改DataFrame数据

使用Pandas修改DataFrame数据很容易。只需使用列名称或行号和适当的赋值操作即可。

import pandas as pd

df = pd.read_csv('data.csv')
df['Population'] = df['Population'] * 1000 # 将Population列中的值乘以1000
print(df.head())

上述代码中，我们将Population列中的所有值乘以1000。

过滤DataFrame数据

有时需要筛选、过滤或选择某些数据。Pandas提供了几个有用的方法，可以轻松地过滤DataFrame中的数据。

import pandas as pd

df = pd.read_csv('data.csv')
# 选择人口大于1亿的国家
df_filtered = df[df['Population'] > 100]
print(df_filtered)

上述代码中，我们使用df['Population'] > 100来筛选出人口大于1亿的国家，并将其存储在df_filtered变量中。

以上是Pandas中DataFrame对象的基础操作方法的完整攻略，希望可以对你有所帮助！

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Pandas:DataFrame对象的基础操作方法 - Python技术站