要将大的Pandas数据框分割成小的数据框列表,可以使用Pandas的groupby函数和循环迭代的方式进行操作。
具体步骤如下:
1.首先导入需要使用的库和数据集
import pandas as pd
import numpy as np
# 导入数据集,本例使用Iris数据集
iris = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data',header=None)
iris.head()
2.然后将数据框按照某一列的值进行分组,生成一个groupby对象
# 按照花的种类分组
grouped = iris.groupby(4)
3.接着使用循环迭代的方式得到每个分组对应的数据框
# 遍历每个分组对应的数据框
for name, group in grouped:
print(name)
print(group.head())
示例代码完整如下:
import pandas as pd
import numpy as np
# 导入数据集,本例使用Iris数据集
iris = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data',header=None)
iris.head()
# 按照花的种类分组
grouped = iris.groupby(4)
# 遍历每个分组对应的数据框
for name, group in grouped:
print(name)
print(group.head())
输出结果如下:
Iris-setosa
0 1 2 3 4
0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
Iris-versicolor
0 1 2 3 4
50 7.0 3.2 4.7 1.4 Iris-versicolor
51 6.4 3.2 4.5 1.5 Iris-versicolor
52 6.9 3.1 4.9 1.5 Iris-versicolor
53 5.5 2.3 4.0 1.3 Iris-versicolor
54 6.5 2.8 4.6 1.5 Iris-versicolor
Iris-virginica
0 1 2 3 4
100 6.3 3.3 6.0 2.5 Iris-virginica
101 5.8 2.7 5.1 1.9 Iris-virginica
102 7.1 3.0 5.9 2.1 Iris-virginica
103 6.3 2.9 5.6 1.8 Iris-virginica
104 6.5 3.0 5.8 2.2 Iris-virginica
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:将大的Pandas数据框分割成小的数据框列表 - Python技术站