通过Numpy数组创建DataFrame的过程中,需要借助于pandas库中的DataFrame构造函数,可以在构造函数中指定参数,如数据(Numpy数组),列标题(列名),索引列等信息。
下面是完整的从Numpy数组创建DataFrame,并指定索引列和列标题的攻略:
- 首先需要导入pandas和numpy库:
import pandas as pd
import numpy as np
- 创建一个Numpy数组作为DataFrame的数据:
data = np.array([[1,2,3], [4,5,6], [7,8,9]])
- 构造列标题(列名):
cols = ['A', 'B', 'C']
- 构造索引列:
idx = ['Row1', 'Row2', 'Row3']
- 创建DataFrame对象:
df = pd.DataFrame(data, columns=cols, index=idx)
- 查看DataFrame:
print(df)
输出结果:
A B C
Row1 1 2 3
Row2 4 5 6
Row3 7 8 9
在上述攻略中,我们创建了一个包含3行3列的Numpy数组,然后通过指定列标题和索引列作为参数来创建DataFrame。
值得一提的是,在构造函数中还可以使用许多其他参数来控制DataFrame的创建,例如数据类型、缺失值的填充方式、是否将索引列作为DataFrame的列等等。这些参数将在日常使用中不断被发掘和实践。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:从一个Numpy数组创建一个DataFrame,并指定索引列和列标题 - Python技术站