Python Pandas中的数据框架属性

2023年3月27日下午2:57 • python-answer

接下来我会为你详细讲解Python Pandas中的数据框架属性，同时给出实例说明。

Python Pandas是一个基于Numpy的数据处理和分析工具，其中最重要的数据结构是数据框架DataFrame。数据框架是一种二维表格结构，每列可以是不同的数据类型（如整数、浮点数、字符串等），其类似于Excel或SQL表。下面就是一些关于数据框架属性详细讲解以及示例说明：

1. 创建数据框架

使用Python字典创建数据框架

示例：

python import pandas as pd data = {'name': ['Jack', 'Lucy', 'Tom', 'Jerry'], 'age': [18, 20, 19, 22]} df = pd.DataFrame(data)

使用numpy数组创建数据框架

示例：

python import pandas as pd import numpy as np data = np.array([[1, 'Alex', 60], [2, 'Bob', 70], [3, 'Ted', 80], [4, 'Jake', 75]]) df = pd.DataFrame(data, columns=['ID', 'Name', 'Score'])

2. 查看数据框架

查看前n行数据：head(n)

示例：

python df.head(2) # 查看前2行数据

查看后n行数据：tail(n)

示例：

python df.tail(3) # 查看后3行数据

查看数据框架的形状（行数、列数）：shape

示例：

python df.shape # 返回(4, 3)，表示该数据框架有4行3列

查看数据框架的列名：columns

示例：

python df.columns # 返回['ID', 'Name', 'Score']，表示该数据框架有三列，分别为ID, Name, Score

3. 数据框架数据选择和过滤

列选择：使用列名或列索引

示例：

python df['ID'] # 返回ID列的所有数据 df[['ID', 'Score']] # 返回ID和Score列的所有数据 df.iloc[:, 2] # 返回第三列所有数据

行选择：使用行索引或行标签

示例：

python df.loc[0] # 返回第一行数据 df[1:3] # 返回2-3行的数据（不包含第4行）

条件过滤

示例：

python df[df['Score'] >= 75] # 返回Score列大于等于75的所有行 df[(df['Score'] >= 70) & (df['Score'] <= 80)] # 返回Score列在70-80之间的所有行

4. 数据框架数据处理

添加列

示例：

python df['Grade'] = pd.Series(['A', 'B', 'C', 'B'])

删除列

示例：

python df.drop('Grade', Axis=1, inplace=True) # 删除Grade列

修改列

示例：

python df['Score'] = df['Score'] * 1.1 # 将Score列每个元素都乘1.1

5. 数据框架数据统计

描述性统计

示例：

python df.describe() # 返回数据框架的描述性统计信息，包括均值、方差、最大值、最小值等

分组统计

示例：

python groupby = df.groupby(['Grade']) groupby['Score'].max() # 返回每个等级（Grade）的最大分数 groupby['Score'].mean() # 返回每个等级（Grade）的分数平均值

以上就是关于Python Pandas中数据框架属性的详细攻略以及实例说明，希望对你有所帮助。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Python Pandas中的数据框架属性 - Python技术站