pandas DataFrame 数据选取,修改,切片的实现

yizhihongxing

Pandas DataFrame数据选取、修改和切片

数据选取

单列选取

选取DataFrame中的单列数据,可以使用列名或列序号两种方式。

使用列名选取:

import pandas as pd

data = {'Name': ['Amy', 'Bob', 'Cathy', 'David'], 'Age': [24, 25, 22, 23], 'Sex': ['Female', 'Male', 'Female', 'Male']}
df = pd.DataFrame(data)

# 使用列名选取单列数据
name = df['Name']

print(name)

输出结果:

0      Amy
1      Bob
2    Cathy
3    David
Name: Name, dtype: object

使用列序号选取:

# 使用列序号选取单列数据
age = df.iloc[:, 1]

print(age)

输出结果:

0    24
1    25
2    22
3    23
Name: Age, dtype: int64

多列选取

选取DataFrame中的多列数据,可以使用列名或列序号两种方式。

使用列名选取:

# 使用列名选取多列数据
selected = df[['Name', 'Sex']]

print(selected)

输出结果:

    Name     Sex
0    Amy  Female
1    Bob    Male
2  Cathy  Female
3  David    Male

使用列序号选取:

# 使用列序号选取多列数据
selected = df.iloc[:, [0, 2]]

print(selected)

输出结果:

    Name     Sex
0    Amy  Female
1    Bob    Male
2  Cathy  Female
3  David    Male

行选取

选取DataFrame中的行数据,可以使用行号或行索引两种方式。

使用行号选取:

# 使用行号选取单行数据
row = df.iloc[0]

print(row)

输出结果:

Name        Amy
Age          24
Sex      Female
Name: 0, dtype: object

使用行索引选取:

# 使用行索引选取单行数据
row = df.loc[0]

print(row)

输出结果:

Name        Amy
Age          24
Sex      Female
Name: 0, dtype: object

选取多行数据:

# 选取多行数据
selected = df.iloc[[0, 2]]

print(selected)

输出结果:

    Name  Age     Sex
0    Amy   24  Female
2  Cathy   22  Female

数据修改

修改单元格数据

修改单元格数据,可以使用行号和列号、行索引和列名两种方式,具体使用哪种方式需要根据实际情况选择。

以“行索引和列名”为例:

# 修改单元格数据(行索引和列名)
df.loc[0, 'Age'] = 30

print(df)

输出结果:

    Name  Age     Sex
0    Amy   30  Female
1    Bob   25    Male
2  Cathy   22  Female
3  David   23    Male

修改列数据

修改列数据,直接使用列名和赋值即可。

# 修改列数据
df['Age'] = [30, 25, 22, 23]

print(df)

输出结果:

    Name  Age     Sex
0    Amy   30  Female
1    Bob   25    Male
2  Cathy   22  Female
3  David   23    Male

修改行数据

修改行数据,可以使用行索引和赋值的方式。

# 修改行数据
df.iloc[0] = ['Amy', 25, 'Male']

print(df)

输出结果:

    Name  Age   Sex
0    Amy   25  Male
1    Bob   25  Male
2  Cathy   22  Male
3  David   23  Male

数据切片

切片选取行数据

选取DataFrame中的行数据,可以使用切片方式。

# 使用切片选取行数据
selected = df[1:3]

print(selected)

输出结果:

    Name  Age   Sex
1    Bob   25  Male
2  Cathy   22  Male

切片选取列数据

选取DataFrame中的列数据,可以使用切片方式。

# 使用切片选取列数据
selected = df.loc[:, 'Name':'Age']

print(selected)

输出结果:

    Name  Age
0    Amy   25
1    Bob   25
2  Cathy   22
3  David  23

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:pandas DataFrame 数据选取,修改,切片的实现 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • 在Python中使用Pandas显示指定年份的所有星期日

    在Python中使用Pandas显示指定年份的所有星期日,主要可以通过以下几个步骤实现: 导入Pandas库 在Python中使用Pandas进行数据处理和分析,首先需要导入Pandas库。 import pandas as pd 创建日期范围 使用Pandas的date_range函数创建一个包含指定年份所有日期的范围。 date_rng = pd.dat…

    python-answer 2023年3月27日
    00
  • Pandas Groupby和计算平均值

    Pandas是一个强大的Python数据分析库,其中的Groupby操作可以方便地对数据进行分组,然后进行各种计算,例如汇总、平均、求和等操作。下面是详细讲解Pandas Groupby和计算平均值的完整攻略,包括实例说明: Pandas Groupby操作 Pandas的Groupby操作可以将数据按照指定的列或索引进行分组,然后针对每个组进行各种操作。首…

    python-answer 2023年3月27日
    00
  • 如何使用Python中的Pandas检查一天是否是工作日

    首先,Pandas是Python中的一个非常强大的数据处理库,内置了很多各式各样的函数和方法。而检查一天是否是工作日的方法,就要用到Pandas中的工作日历处理函数。下面是详细的攻略步骤: 步骤1:导入Pandas库和相关模块 import pandas as pd from pandas.tseries.offsets import BDay Pandas…

    python-answer 2023年3月27日
    00
  • Python 比较两个 CSV 文件的三种方法并打印出差异

    针对这个问题,我们可以提供以下攻略。 1. 背景介绍 首先,我们需要明确一些背景信息。CSV 是一种纯文本格式文件,常用于存储表格数据。当我们需要比较两个 CSV 文件时,可能需要用到以下几种方法: 使用 Python 标准库中的 csv 模块对比; 使用第三方 Python 包 pandas 进行对比; 使用 csvdiff 工具进行对比。 接下来,我们分…

    python 2023年6月13日
    00
  • Pandas数据框架中的重新索引

    重新索引是Pandas数据框架中的一个重要操作,可以让我们根据需要重新排序DataFrame中的行、列或者元素,或者新增或删除行、列。下面我将为大家详细介绍Pandas数据框架中的重新索引的攻略。 基本概念 在Pandas数据框架中,重新索引(reindex)是指将已有的数据从原始数据的Index序列中取出,按照新的Index序列重新排列的操作。具体而言,就…

    python-answer 2023年3月27日
    00
  • pandas数据清洗实现删除的项目实践

    本文将介绍如何使用Pandas对数据进行清洗,并实现删除不必要的数据。本文的目的是让读者了解Pandas数据清洗的基本原理和实现方法,方便读者在自己的数据分析项目中使用Pandas快速、高效地完成数据清洗。本文假定读者已经熟悉了Pandas的基本数据操作和Python编程语言。 1. 加载数据 首先,我们需要将要清洗的数据加载进来。在本示例中,我们将使用一个…

    python 2023年5月14日
    00
  • Python使用Pandas对csv文件进行数据处理的方法

    首先,需要安装Pandas库,可以使用以下命令进行安装: pip install pandas 安装完成后,可以使用以下代码读取csv文件: import pandas as pd df = pd.read_csv(‘data.csv’) print(df.head()) # 打印前五行数据 这里data.csv是csv文件的文件名,pd.read_csv函…

    python 2023年5月14日
    00
  • pandas 快速处理 date_time 日期格式方法

    下面是关于pandas快速处理date_time日期格式的完整攻略: Pandas快速处理date_time日期格式方法 1. 字符串转换为日期格式 在pandas中,我们可以使用to_datetime()函数将日期字符串快速转换为日期格式,并且可以指定日期字符串的格式。比如我们有如下日期字符串: date_str = ‘2021/07/23’ 我们可以使用…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部