Python Pandas学习之Pandas数据结构详解
简介
Pandas是基于NumPy的一个开源数据分析与处理库,提供了各种数据结构和处理工具,使我们能够使用Python快速处理各种数据。Pandas主要包含三种数据结构:Series、DataFrame和Panel。
Series
Series是一种一维数组结构,可以保存任何数据类型。我们可以通过传递一系列值来创建Series对象,默认情况下,它会自动创建默认的整数索引。
示例1:
import pandas as pd
s1 = pd.Series([1, 3, 5, 7, 9])
print(s1)
输出结果:
0 1
1 3
2 5
3 7
4 9
dtype: int64
示例2:
s2 = pd.Series(['a', 'b', 'c', 'd', 'e'])
print(s2)
输出结果:
0 a
1 b
2 c
3 d
4 e
dtype: object
DataFrame
DataFrame是一种二维表格数据结构,类似于Excel中的表格或SQL中的表。每个列可以是不同的数据类型,例如数字、字符串或布尔值等。DataFrame既有行索引也有列索引。
示例1:
import pandas as pd
df1 = pd.DataFrame({'score': [98, 91, 87, 67, 85],
'name': ['Tom', 'Jack', 'Lily', 'Lucy', 'Mike']})
print(df1)
输出结果:
score name
0 98 Tom
1 91 Jack
2 87 Lily
3 67 Lucy
4 85 Mike
示例2:
df2 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print(df2)
输出结果:
A B
0 1 4
1 2 5
2 3 6
Panel
Panel是一个三维的数据结构,类似于DataFrame中的多个表格或Excel四个维度中的三维。
由于使用Panel时数据通常是超大型的,因此该数据结构仅在极少数情况下使用。
结语
Pandas三种数据结构的介绍到此结束。除此之外,Pandas还提供了许多处理数据的方法和函数,例如数据过滤、处理、排序、聚合和分组等等,应用非常广泛。需要使用Pandas的开发者可以查阅Pandas官方文档进行更详细的学习。
感谢阅读!
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python Pandas学习之Pandas数据结构详解 - Python技术站