Pandas loc、iloc用法详解

Pandas中的loc和iloc都是用来选择数据的方法,主要作用是在DataFrame中根据行、列的标签或位置进行数据的选择和切片。

具体来说,loc通过标签选择数据,iloc通过位置选择数据。loc和iloc都可以使用切片和布尔索引,还支持多层索引和高级索引等操作。

下面详细介绍一下这两种方法的用法:

loc方法

loc方法是通过行标签和列标签来访问数据的。语法如下:

df.loc[row_label, col_label]

其中,row_label可以是单个标签、标签列表或切片,用于定位行;col_label也可以是单个标签、标签列表或切片,用于定位列。如果要选择所有行或所有列,可以使用“:”作为标签。

示例代码:

import pandas as pd

# 创建DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c'])

# 通过单个标签访问数据
print(df.loc['a', 'A'])  # 输出 1

# 通过标签列表访问数据
print(df.loc[['a', 'b'], ['A', 'B']])  # 输出
#    A  B
# a  1  4
# b  2  5

# 通过切片访问数据
print(df.loc['a':'c', 'A':'B'])  # 输出
#    A  B
# a  1  4
# b  2  5
# c  3  6

# 选择所有行和所有列
print(df.loc[:, :])  # 输出
#    A  B  C
# a  1  4  7
# b  2  5  8
# c  3  6  9

iloc方法

iloc方法是通过行索引和列索引来访问数据的。语法如下:

df.iloc[row_index, col_index]

其中,row_index可以是单个索引、索引列表或切片,用于定位行;col_index也可以是单个索引、索引列表或切片,用于定位列。如果要选择所有行或所有列,可以使用“:”作为索引。

示例代码:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
        'age': [25, 30, 35, 40, 45],
        'score': [88, 92, 95, 70, 65]}

df = pd.DataFrame(data)

# 选择第2行
print(df.iloc[1])

# 选择第2到第4行,第1到第2列
print(df.iloc[1:4, 0:2])

# 选择多行,单列
print(df.iloc[[0, 2, 4], 0])

输出结果为:

name     Bob
age       30
score     92
Name: 1, dtype: object
      name  age
1      Bob   30
2  Charlie   35
3    David   40
0      Alice
2    Charlie
4      Emily
Name: name, dtype: object

需要注意的是,loc和iloc选择行和列的方式略有不同,loc是按照标签索引,而iloc是按照整数位置索引。另外,使用loc和iloc时可以省略行或列的位置或标签,例如df.loc[:, 'name']表示选择所有行的name列。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas loc、iloc用法详解 - Python技术站

(5)
上一篇 2023年3月5日
下一篇 2023年3月5日

相关文章

  • 详解Pandas数据重采样(resample)的3种使用方法

    Pandas中的resample方法用于对时间序列数据进行重采样,可以将数据从一个时间频率转换为另一个时间频率,比如将日频率的数据转换为月频率的数据。 resample的语法格式如下: DataFrame.resample(rule, axis=0, closed=None, label=None, convention='start',…

    Pandas 2023年3月6日
    00
  • Pandas最常用的7个统计函数详解

    在数据分析的过程中,使用统计函数有助于我们理解和分析数据。Pandas作为一个最热门的Python数据处理库,提供了许多有用的统计函数,用于对数据进行汇总、分组、聚合和计算。 下面的表格是一些常见的统计函数: 函数名称 函数功能说明 describe() 生成数据集的描述性统计信息,包括计数、平均值、标准差、最小值、最大值和四分位数等。 mean() 计算序…

    Pandas 2023年3月5日
    00
  • Pandas 最常用的两种排序方法

    Pandas提供了两种排序方式:按标签排序和按数值排序。 按标签排序 按标签排序使用 .sort_index() 方法,可以按照索引的标签进行排序,默认为升序排列。例如: import pandas as pd # 创建一个示例DataFrame df = pd.DataFrame({'col1': [3, 1, 2], 'co…

    Pandas 2023年3月5日
    00
  • Pandas对象使用自定义函数的3个方法!

    Pandas为什么要使用自定义函数? 使用自定义函数可以让我们更灵活地对数据进行处理和分析。在某些情况下,内置的函数可能无法满足我们的需求,例如需要进行特定的数据清洗、转换或计算。这时候,我们可以编写自己的函数来处理数据。同时,自定义函数也可以让我们更好地复用代码,提高开发效率。 接下来我们将详细介绍Pandas使用自定义函数的4种方法。 Pandas使用自…

    Pandas 2023年3月4日
    00
  • Pandas处理缺失值的4种方法

    什么是缺失值 在实际数据分析过程中,经常会遇到一些数据缺失的情况,这种情况可能是由于以下原因导致的: 数据收集的不完整:有些数据可能由于各种原因无法获取或者未收集到。 数据输入错误:数据收集者可能会犯一些输入错误,例如遗漏一些数据或者输入了一些不正确的数据。 数据处理错误:数据处理过程中可能会犯一些错误,例如计算错误或者数据合并错误等。 数据保存错误:数据保…

    Pandas 2023年3月5日
    00
  • Pandas 最常用的6种遍历方法

    遍历是众多编程语言中必备的一种操作,比如 Python 语言通过 for 循环来遍历列表结构。而在 Pandas 中同样也是使用 for 循环进行遍历,通过for遍历后,Series 可直接获取相应的 value,而 DataFrame 则会获取列标签。 以下是最常用的几种遍历方法: for 循环遍历每一行/列 使用 for 循环可以遍历 DataFrame…

    Pandas 2023年3月4日
    00
  • Pandas reindex重置索引的4种方法

    Pandas的reindex()方法可以用来重新排列DataFrame或Series的索引,并返回一个具有新索引的新对象。reindex()方法有以下几种常用的用法: Series.reindex() Series.reindex()方法用于Series类型,可以根据给定的索引值重新排列Series的索引。当索引值在原Series中不存在时,对应的值会被填充…

    Pandas 2023年3月4日
    00
  • Pandas DataFrame结构对象常用的属性和方法

    Pandas DataFrame是一个二维表结构,包含了行和列的标签,每一列可以有不同的数据类型。 以下是Pandas DataFrame结构对象常用的属性和方法: DataFrame结构对象属性 DataFrame对象常用的属性有: shape:返回DataFrame的形状(行数、列数) index:返回DataFrame的行索引 columns:返回Da…

    Pandas 2023年3月4日
    00
合作推广
合作推广
分享本页
返回顶部