Pandas loc、iloc用法详解

Pandas中的loc和iloc都是用来选择数据的方法,主要作用是在DataFrame中根据行、列的标签或位置进行数据的选择和切片。

具体来说,loc通过标签选择数据,iloc通过位置选择数据。loc和iloc都可以使用切片和布尔索引,还支持多层索引和高级索引等操作。

下面详细介绍一下这两种方法的用法:

loc方法

loc方法是通过行标签和列标签来访问数据的。语法如下:

df.loc[row_label, col_label]

其中,row_label可以是单个标签、标签列表或切片,用于定位行;col_label也可以是单个标签、标签列表或切片,用于定位列。如果要选择所有行或所有列,可以使用“:”作为标签。

示例代码:

import pandas as pd

# 创建DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9]}, index=['a', 'b', 'c'])

# 通过单个标签访问数据
print(df.loc['a', 'A'])  # 输出 1

# 通过标签列表访问数据
print(df.loc[['a', 'b'], ['A', 'B']])  # 输出
#    A  B
# a  1  4
# b  2  5

# 通过切片访问数据
print(df.loc['a':'c', 'A':'B'])  # 输出
#    A  B
# a  1  4
# b  2  5
# c  3  6

# 选择所有行和所有列
print(df.loc[:, :])  # 输出
#    A  B  C
# a  1  4  7
# b  2  5  8
# c  3  6  9

iloc方法

iloc方法是通过行索引和列索引来访问数据的。语法如下:

df.iloc[row_index, col_index]

其中,row_index可以是单个索引、索引列表或切片,用于定位行;col_index也可以是单个索引、索引列表或切片,用于定位列。如果要选择所有行或所有列,可以使用“:”作为索引。

示例代码:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
        'age': [25, 30, 35, 40, 45],
        'score': [88, 92, 95, 70, 65]}

df = pd.DataFrame(data)

# 选择第2行
print(df.iloc[1])

# 选择第2到第4行,第1到第2列
print(df.iloc[1:4, 0:2])

# 选择多行,单列
print(df.iloc[[0, 2, 4], 0])

输出结果为:

name     Bob
age       30
score     92
Name: 1, dtype: object
      name  age
1      Bob   30
2  Charlie   35
3    David   40
0      Alice
2    Charlie
4      Emily
Name: name, dtype: object

需要注意的是,loc和iloc选择行和列的方式略有不同,loc是按照标签索引,而iloc是按照整数位置索引。另外,使用loc和iloc时可以省略行或列的位置或标签,例如df.loc[:, 'name']表示选择所有行的name列。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas loc、iloc用法详解 - Python技术站

(5)
上一篇 2023年3月5日
下一篇 2023年3月5日

相关文章

  • 详解Pandas中的时间序列

    Pandas是一个强大的数据分析工具,它的时间序列处理功能也非常强大。Pandas提供了一些专门用于处理时间序列的数据类型和函数,能够方便地对时间序列数据进行处理和分析。 下面将详细介绍Pandas时间序列的相关知识。 DatetimeIndex 在Pandas中,DatetimeIndex是一个表示时间序列的数据类型,它能够方便地对时间序列进行索引和切片操…

    Pandas 2023年3月6日
    10
  • Pandas绘图方法(plot)详解

    Pandas 在数据可视化方面有着较为广泛的应用,Pandas 的 plot() 方法可以用来绘制各种类型的统计图表,包括线图、散点图、柱状图、饼图、密度图等等。 plot() 方法是基于matplotlib库构建的,因此具有很高的灵活性和可定制性,可以通过参数设置对图表进行调整。plot()方法可以直接作用于Series、DataFrame和GroupBy…

    2023年3月6日 Pandas
    00
  • Pandas读取文件数据常用的5种方法

    当使用 Pandas 做数据分析的时,需要读取事先准备好的数据集,这是做数据分析的第一步。 Panda 提供了很多读取数据的方法: pd.read_csv():读取CSV文件 pd.read_excel():读取Excel文件 pd.read_sql():读取SQL数据库中的数据 pd.read_json():读取JSON文件 pd.read_html():…

    Pandas 2023年3月6日
    00
  • Pandas对象使用自定义函数的3个方法!

    Pandas为什么要使用自定义函数? 使用自定义函数可以让我们更灵活地对数据进行处理和分析。在某些情况下,内置的函数可能无法满足我们的需求,例如需要进行特定的数据清洗、转换或计算。这时候,我们可以编写自己的函数来处理数据。同时,自定义函数也可以让我们更好地复用代码,提高开发效率。 接下来我们将详细介绍Pandas使用自定义函数的4种方法。 Pandas使用自…

    Pandas 2023年3月4日
    00
  • Pandas 最常用的两种排序方法

    Pandas提供了两种排序方式:按标签排序和按数值排序。 按标签排序 按标签排序使用 .sort_index() 方法,可以按照索引的标签进行排序,默认为升序排列。例如: import pandas as pd # 创建一个示例DataFrame df = pd.DataFrame({'col1': [3, 1, 2], 'co…

    Pandas 2023年3月5日
    00
  • Pandas处理缺失值的4种方法

    什么是缺失值 在实际数据分析过程中,经常会遇到一些数据缺失的情况,这种情况可能是由于以下原因导致的: 数据收集的不完整:有些数据可能由于各种原因无法获取或者未收集到。 数据输入错误:数据收集者可能会犯一些输入错误,例如遗漏一些数据或者输入了一些不正确的数据。 数据处理错误:数据处理过程中可能会犯一些错误,例如计算错误或者数据合并错误等。 数据保存错误:数据保…

    Pandas 2023年3月5日
    00
  • Pandas最常用的设置数据显示格式的11种方法

    在用 Pandas 做数据分析的过程中,为了更好地呈现和展示数据,使数据更易读、易于理解,从而提高数据分析的效率和准确性,我们经常需要设置数据的显示格式。 通过设置数据显示格式,可以调整数据的小数位数、数值的对齐方式、列宽等参数,使得数据在表格中更美观、整洁,同时也更符合数据的实际含义。此外,设置数据显示格式还可以对数据进行格式化输出,如将数值格式化为货币、…

    Pandas 2023年3月5日
    00
  • Pandas最常用的7种字符串处理方法

    Pandas是一个强大的数据处理工具,除了能处理数值和时间序列等数据类型外,还能够方便地处理字符串数据。 常用的字符串处理函数如下表所示: 函数名称 函数功能说明 lower() 将的字符串转换为小写。 upper() 将的字符串转换为大写。 len() 得出字符串的长度。 strip() 去除字符串两边的空格(包含换行符)。 split() 用指定的分割符…

    Pandas 2023年3月5日
    00
合作推广
合作推广
分享本页
返回顶部