pandas DataFrame 数据选取,修改,切片的实现

Pandas DataFrame数据选取、修改和切片

数据选取

单列选取

选取DataFrame中的单列数据,可以使用列名或列序号两种方式。

使用列名选取:

import pandas as pd

data = {'Name': ['Amy', 'Bob', 'Cathy', 'David'], 'Age': [24, 25, 22, 23], 'Sex': ['Female', 'Male', 'Female', 'Male']}
df = pd.DataFrame(data)

# 使用列名选取单列数据
name = df['Name']

print(name)

输出结果:

0      Amy
1      Bob
2    Cathy
3    David
Name: Name, dtype: object

使用列序号选取:

# 使用列序号选取单列数据
age = df.iloc[:, 1]

print(age)

输出结果:

0    24
1    25
2    22
3    23
Name: Age, dtype: int64

多列选取

选取DataFrame中的多列数据,可以使用列名或列序号两种方式。

使用列名选取:

# 使用列名选取多列数据
selected = df[['Name', 'Sex']]

print(selected)

输出结果:

    Name     Sex
0    Amy  Female
1    Bob    Male
2  Cathy  Female
3  David    Male

使用列序号选取:

# 使用列序号选取多列数据
selected = df.iloc[:, [0, 2]]

print(selected)

输出结果:

    Name     Sex
0    Amy  Female
1    Bob    Male
2  Cathy  Female
3  David    Male

行选取

选取DataFrame中的行数据,可以使用行号或行索引两种方式。

使用行号选取:

# 使用行号选取单行数据
row = df.iloc[0]

print(row)

输出结果:

Name        Amy
Age          24
Sex      Female
Name: 0, dtype: object

使用行索引选取:

# 使用行索引选取单行数据
row = df.loc[0]

print(row)

输出结果:

Name        Amy
Age          24
Sex      Female
Name: 0, dtype: object

选取多行数据:

# 选取多行数据
selected = df.iloc[[0, 2]]

print(selected)

输出结果:

    Name  Age     Sex
0    Amy   24  Female
2  Cathy   22  Female

数据修改

修改单元格数据

修改单元格数据,可以使用行号和列号、行索引和列名两种方式,具体使用哪种方式需要根据实际情况选择。

以“行索引和列名”为例:

# 修改单元格数据(行索引和列名)
df.loc[0, 'Age'] = 30

print(df)

输出结果:

    Name  Age     Sex
0    Amy   30  Female
1    Bob   25    Male
2  Cathy   22  Female
3  David   23    Male

修改列数据

修改列数据,直接使用列名和赋值即可。

# 修改列数据
df['Age'] = [30, 25, 22, 23]

print(df)

输出结果:

    Name  Age     Sex
0    Amy   30  Female
1    Bob   25    Male
2  Cathy   22  Female
3  David   23    Male

修改行数据

修改行数据,可以使用行索引和赋值的方式。

# 修改行数据
df.iloc[0] = ['Amy', 25, 'Male']

print(df)

输出结果:

    Name  Age   Sex
0    Amy   25  Male
1    Bob   25  Male
2  Cathy   22  Male
3  David   23  Male

数据切片

切片选取行数据

选取DataFrame中的行数据,可以使用切片方式。

# 使用切片选取行数据
selected = df[1:3]

print(selected)

输出结果:

    Name  Age   Sex
1    Bob   25  Male
2  Cathy   22  Male

切片选取列数据

选取DataFrame中的列数据,可以使用切片方式。

# 使用切片选取列数据
selected = df.loc[:, 'Name':'Age']

print(selected)

输出结果:

    Name  Age
0    Amy   25
1    Bob   25
2  Cathy   22
3  David  23

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas DataFrame 数据选取,修改,切片的实现 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • 解决编码问题:UnicodeDecodeError: ‘utf-8’ codec can’t decod

    当我们在处理文本数据时,经常会遇到编码问题。其中一个常见的问题是“UnicodeDecodeError: ‘utf-8’ codec can’t decode”的错误。这个错误会提示我们在将字节码解码为Unicode字符串时出现问题。下面是解决这个问题的完整攻略: 确认文件编码 在使用Python处理文本文件时,首先需要确认文件的编码格式。如果文件的编码格式…

    python 2023年5月14日
    00
  • 在Pandas数据框架中选择具有最大和最小值的行

    在 Pandas 数据框架中选择具有最大和最小值的行有多种方法,下面将详细介绍其中两种方法: 使用 loc 方法结合 idxmin 和 idxmax 方法 import pandas as pd import numpy as np # 创建预置数据 data = {‘A’: [1, 2, 3], ‘B’: [4, 5, 6], ‘C’: [7, 8, 9]…

    python-answer 2023年3月27日
    00
  • 如何在Pandas中按组计算观察值

    在 Pandas 中,我们可以通过 groupby 函数将数据集分组,并对分组后的数据进行聚合操作来计算观察值。 下面是在 Pandas 中按组计算观察值的完整攻略,包括数据准备、分组、聚合等详细过程。 数据准备 首先需要准备数据集。我们使用一个示例数据集,包含了一些顾客在不同时间、不同地点购买商品的情况。 import pandas as pd data …

    python-answer 2023年3月27日
    00
  • 如何在Python中使用Pandas从excel表中创建一个带有多个索引的数据透视表

    通过Pandas,我们可以很方便地从Excel表中读取数据并创建数据透视表。一个数据透视表可以是带有一个或多个索引的,也可以是带有多个计算值的表格,便于对大数据进行分析和可视化。下面是在Python中使用Pandas创建一个带有多个索引的数据透视表的步骤。 步骤一:导入Pandas库 首先要导入pandas库,具体代码如下: import pandas as…

    python-answer 2023年3月27日
    00
  • 在pandas中对行进行分组

    Pandas是用Python进行数据处理和数据分析的一个核心库。其中一项关键的功能是能够对数据进行分组和归纳。下面是对行进行分组的完整攻略。 步骤一:加载数据 首先需要加载数据。可以从CSV文件、数据库、其他文件和数据源中加载数据。这里以读取CSV文件为例演示: import pandas as pd # 加载csv文件 df=pd.read_csv(&qu…

    python-answer 2023年3月27日
    00
  • python Pandas如何对数据集随机抽样

    Python Pandas是一个基于NumPy的Python库,提供了一个高效的数据分析工具集。在Pandas中,可以通过sample函数来对大型数据集进行随机抽样。 1. sample函数介绍 Pandas通过sample函数来对数据集进行随机抽样。sample函数的语法如下: DataFrame.sample(n=None, frac=None, rep…

    python 2023年5月14日
    00
  • 分享20个Pandas短小精悍的数据操作

    分享20个Pandas短小精悍的数据操作 在数据分析和处理领域,Pandas是一个非常常用的Python库,并且也是大多数公司数据科学家必知必会的技能之一。 本文将分享20个Pandas短小精悍的数据操作,从解析多重索引到筛选、排序、重构 DataFrame,以及文本操作和其他常见任务等。 解析多重索引 使用MultiIndex.get_level_valu…

    python 2023年5月14日
    00
  • 用于数据分析的小提琴图

    小提琴图是一种基于箱线图和核密度估计可视化方法的图表类型,用于展示数据的分布情况。 下面是使用matplotlib库绘制小提琴图的示例代码: import matplotlib.pyplot as plt import numpy as np # 生成随机数据 data = [np.random.normal(0, std, 100) for std in …

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部