接下来我会为你详细讲解Python Pandas中的数据框架属性,同时给出实例说明。
Python Pandas是一个基于Numpy的数据处理和分析工具,其中最重要的数据结构是数据框架DataFrame。数据框架是一种二维表格结构,每列可以是不同的数据类型(如整数、浮点数、字符串等),其类似于Excel或SQL表。下面就是一些关于数据框架属性详细讲解以及示例说明:
1. 创建数据框架
- 使用Python字典创建数据框架
示例:
python
import pandas as pd
data = {'name': ['Jack', 'Lucy', 'Tom', 'Jerry'], 'age': [18, 20, 19, 22]}
df = pd.DataFrame(data)
- 使用numpy数组创建数据框架
示例:
python
import pandas as pd
import numpy as np
data = np.array([[1, 'Alex', 60], [2, 'Bob', 70], [3, 'Ted', 80], [4, 'Jake', 75]])
df = pd.DataFrame(data, columns=['ID', 'Name', 'Score'])
2. 查看数据框架
- 查看前n行数据:head(n)
示例:
python
df.head(2) # 查看前2行数据
- 查看后n行数据:tail(n)
示例:
python
df.tail(3) # 查看后3行数据
- 查看数据框架的形状(行数、列数):shape
示例:
python
df.shape # 返回(4, 3),表示该数据框架有4行3列
- 查看数据框架的列名:columns
示例:
python
df.columns # 返回['ID', 'Name', 'Score'],表示该数据框架有三列,分别为ID, Name, Score
3. 数据框架数据选择和过滤
- 列选择:使用列名或列索引
示例:
python
df['ID'] # 返回ID列的所有数据
df[['ID', 'Score']] # 返回ID和Score列的所有数据
df.iloc[:, 2] # 返回第三列所有数据
- 行选择:使用行索引或行标签
示例:
python
df.loc[0] # 返回第一行数据
df[1:3] # 返回2-3行的数据(不包含第4行)
- 条件过滤
示例:
python
df[df['Score'] >= 75] # 返回Score列大于等于75的所有行
df[(df['Score'] >= 70) & (df['Score'] <= 80)] # 返回Score列在70-80之间的所有行
4. 数据框架数据处理
- 添加列
示例:
python
df['Grade'] = pd.Series(['A', 'B', 'C', 'B'])
- 删除列
示例:
python
df.drop('Grade', Axis=1, inplace=True) # 删除Grade列
- 修改列
示例:
python
df['Score'] = df['Score'] * 1.1 # 将Score列每个元素都乘1.1
5. 数据框架数据统计
- 描述性统计
示例:
python
df.describe() # 返回数据框架的描述性统计信息,包括均值、方差、最大值、最小值等
- 分组统计
示例:
python
groupby = df.groupby(['Grade'])
groupby['Score'].max() # 返回每个等级(Grade)的最大分数
groupby['Score'].mean() # 返回每个等级(Grade)的分数平均值
以上就是关于Python Pandas中数据框架属性的详细攻略以及实例说明,希望对你有所帮助。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python Pandas中的数据框架属性 - Python技术站