Pandas是Python中最受欢迎的数据分析工具之一,提供了各种各样处理结构化数据的功能。其中,DataFrame是最为常见的数据结构之一,类似于Excel中的表格,常用于处理二维数组,但是也可以用于处理多维数组。
以下是Pandas中DataFrame对象的基础操作方法的完整攻略:
创建DataFrame对象
要使用DataFrame最基本的操作是创建它。Pandas提供了许多方法来创建DataFrame。其中,一个常见的方法是使用字典(dict)来创建一个DataFrame:
import pandas as pd
data = {'Country': ['China', 'India', 'United States', 'Indonesia', 'Pakistan', 'Brazil', 'Nigeria', 'Bangladesh', 'Russia', 'Mexico'],
'Population': [1393.8, 1366.4, 329.9, 269.6, 220.8, 211.8, 206.1, 168.7, 146.8, 126.6],
'GDP': [14342.9, 2597.5, 21427.3, 1015.4, 278.2, 2064.5, 410.7, 275.4, 1715.3, 1211.4]}
df = pd.DataFrame(data)
print(df)
上述代码创建了一个DataFrame对象,该DataFrame包含了每个国家的名称、人口和GDP。使用print(df)命令来查看DataFrame的内容。
读取CSV文件来创建DataFrame对象
通常,数据都以CSV(逗号分隔)文件格式存储。使用Pandas,可以轻松地读取CSV文件并将其转换为DataFrame对象。
import pandas as pd
df = pd.read_csv('data.csv')
print(df.head())
上述代码使用read_csv()方法读取"data.csv"文件,然后使用head()方法打印前5条记录。
访问DataFrame数据
使用DataFrame对象,可以轻松地访问它所包含的数据。可以使用列/行名称或列/行号来访问DataFrame。
import pandas as pd
df = pd.read_csv('data.csv')
print(df['Country']) # 访问Country列数据
print(df.iloc[2]) # 访问第3行数据
上述代码中,我们使用列名称Country和.iloc方法分别访问Country列和第3行数据。
修改DataFrame数据
使用Pandas修改DataFrame数据很容易。只需使用列名称或行号和适当的赋值操作即可。
import pandas as pd
df = pd.read_csv('data.csv')
df['Population'] = df['Population'] * 1000 # 将Population列中的值乘以1000
print(df.head())
上述代码中,我们将Population列中的所有值乘以1000。
过滤DataFrame数据
有时需要筛选、过滤或选择某些数据。Pandas提供了几个有用的方法,可以轻松地过滤DataFrame中的数据。
import pandas as pd
df = pd.read_csv('data.csv')
# 选择人口大于1亿的国家
df_filtered = df[df['Population'] > 100]
print(df_filtered)
上述代码中,我们使用df['Population'] > 100来筛选出人口大于1亿的国家,并将其存储在df_filtered变量中。
以上是Pandas中DataFrame对象的基础操作方法的完整攻略,希望可以对你有所帮助!
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas:DataFrame对象的基础操作方法 - Python技术站