将大的Pandas数据框分割成小的数据框列表

yizhihongxing

要将大的Pandas数据框分割成小的数据框列表,可以使用Pandas的groupby函数和循环迭代的方式进行操作。

具体步骤如下:

1.首先导入需要使用的库和数据集

import pandas as pd
import numpy as np

# 导入数据集,本例使用Iris数据集
iris = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data',header=None)
iris.head()

2.然后将数据框按照某一列的值进行分组,生成一个groupby对象

# 按照花的种类分组
grouped = iris.groupby(4)

3.接着使用循环迭代的方式得到每个分组对应的数据框

# 遍历每个分组对应的数据框
for name, group in grouped:
    print(name)
    print(group.head())

示例代码完整如下:

import pandas as pd
import numpy as np

# 导入数据集,本例使用Iris数据集
iris = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data',header=None)
iris.head()

# 按照花的种类分组
grouped = iris.groupby(4)

# 遍历每个分组对应的数据框
for name, group in grouped:
    print(name)
    print(group.head())

输出结果如下:

Iris-setosa
     0    1    2    3            4
0  5.1  3.5  1.4  0.2  Iris-setosa
1  4.9  3.0  1.4  0.2  Iris-setosa
2  4.7  3.2  1.3  0.2  Iris-setosa
3  4.6  3.1  1.5  0.2  Iris-setosa
4  5.0  3.6  1.4  0.2  Iris-setosa
Iris-versicolor
      0    1    2    3                4
50  7.0  3.2  4.7  1.4  Iris-versicolor
51  6.4  3.2  4.5  1.5  Iris-versicolor
52  6.9  3.1  4.9  1.5  Iris-versicolor
53  5.5  2.3  4.0  1.3  Iris-versicolor
54  6.5  2.8  4.6  1.5  Iris-versicolor
Iris-virginica
       0    1    2    3               4
100  6.3  3.3  6.0  2.5  Iris-virginica
101  5.8  2.7  5.1  1.9  Iris-virginica
102  7.1  3.0  5.9  2.1  Iris-virginica
103  6.3  2.9  5.6  1.8  Iris-virginica
104  6.5  3.0  5.8  2.2  Iris-virginica

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:将大的Pandas数据框分割成小的数据框列表 - Python技术站

(1)
上一篇 2023年3月27日
下一篇 2023年3月27日

相关文章

  • python向xls写入数据(包括合并,边框,对齐,列宽)

    下面就是关于Python向xls写入数据(包括合并,边框,对齐,列宽)的完整攻略。 一、需求背景 我们在日常的工作和生活中,经常需要将数据写入Excel文档,对于Python来说,这也是比较常见的操作。但是,单纯地将数据写入Excel文档显然是无法满足工作的需求的,因为很多情况下,我们还需要将数据进行处理,比如合并单元格、设置边框样式、设置对齐方式和设置列宽…

    python 2023年5月14日
    00
  • MySQL存储Json字符串遇到的问题与解决方法

    MySQL存储Json字符串遇到的问题与解决方法 在进行开发时,我们通常会使用MySQL数据库存储数据。MySQL 5.7版本及以上版本支持存储Json字符串,但是在实际操作中会遇到一些问题和坑点。本文将详细讲解MySQL存储Json字符串遇到的问题以及解决方法。 问题 在MySQL中存储JSON字符串时,可能会遇到以下问题: 插入JSON字符串失败 SQL…

    python 2023年5月14日
    00
  • 基于两列的Pandas数据框架中删除重复的内容

    基于两列的Pandas数据框架中删除重复的内容的攻略如下所述: 首先导入必要的库,创建示例数据: import pandas as pd df = pd.DataFrame({ ‘col1’: [‘A’, ‘B’, ‘C’, ‘D’, ‘E’], ‘col2’: [‘W’, ‘X’, ‘X’, ‘Y’, ‘Z’] }) 其中,col1和col2分别代表两个列…

    python-answer 2023年3月27日
    00
  • python读取Android permission文件

    Python读取Android permission文件的完整攻略如下: 1. 准备权限文件 首先,需要准备好Android权限文件。通常情况下,我们可以通过下载对应版本的Android源码来获取该文件,在源码路径下的frameworks/base/core/res/AndroidManifest.xml中可以找到该文件。将该文件复制至本地。 2. 安装xm…

    python 2023年6月13日
    00
  • 如何从Pandas数据框架中创建饼图

    下面是从Pandas数据框架中创建饼图的完整攻略,并提供一个实例说明。 步骤1:导入所需要的库 Pandas创建了数据帧,Matplotlib库创建了图形,使用这两个库可以快速创建各种图形。因此,在开始绘制饼图之前,需要导入Pandas和Matplotlib库。 import pandas as pd import matplotlib.pyplot as …

    python-answer 2023年3月27日
    00
  • 如何在Pandas数据框架中设置单元格值

    在Pandas数据框架中设置单元格值可以使用.loc[]方法。针对不同的需求,设置单元格值也有多种不同的方法。 设置单个单元格的值 import pandas as pd # 创建一个数据框架 data = {‘name’: [‘Alice’, ‘Bob’, ‘Charlie’, ‘David’], ‘age’: [25, 32, 18, 47], ‘cit…

    python-answer 2023年3月27日
    00
  • 详解pandas如何去掉、过滤数据集中的某些值或者某些行?

    当我们分析数据时,有时候会需要去掉不需要的数据或者行,Pandas提供了几种方法实现这种需求。 1. 使用dropna函数去掉缺失数据 dropna函数可以用来去除含有缺失值NAN的行或者列,它的使用方法如下: import pandas as pd #创建一个包含一些缺失值的DataFrame df = pd.DataFrame({‘A’: [1, 2, …

    python 2023年5月14日
    00
  • Pandas:DataFrame对象的基础操作方法

    Pandas是Python中最受欢迎的数据分析工具之一,提供了各种各样处理结构化数据的功能。其中,DataFrame是最为常见的数据结构之一,类似于Excel中的表格,常用于处理二维数组,但是也可以用于处理多维数组。 以下是Pandas中DataFrame对象的基础操作方法的完整攻略: 创建DataFrame对象 要使用DataFrame最基本的操作是创建它…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部