当我们在用Python进行数据分析时,一种最基础的数据结构是 Series。 Series 是 Pandas 库中的一种数据类型,它类似于 Excel 中的列,它由一个索引和一个数据组成。
Pandas 中的 Series 与 NumPy 中的 ndarray 类似,二者之间最大的区别是 Series 有索引(index),因此可以基于标签来获取数据,而 NumPy 中只能使用整数下标进行元素访问。
pd.Series() 函数是 Pandas 中创建 Series 的方法,下面我们来详细讲解如何使用它。
1.语法
pd.Series(data, index, dtype, copy)
其中,
-
data: 列表、字典、ndarray 或者标量值
-
index: 索引值,必须是唯一和散列的,与 data 的长度一致。如果没有指定索引,默认从 0 开始,并且使用整数增量。
-
dtype: dtype 表示数据类型。如果没有,将推断数据类型。
-
copy: 复制数据,默认为 False。
2.方法一:从列表中创建一个Series
要从列表中创建一个 Series,首先需要导入 Pandas 库,然后定义一个列表,并将其传递给 pd.Series() 函数中,如下所示:
import pandas as pd
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)
输出结果:
0 1
1 2
2 3
3 4
4 5
dtype: int64
输出结果中,Series 对象的第一列是索引,索引从0开始,第二列是原始列表中的值。可以看出,如果没有指定索引,默认会使用整数标签。
3.方法二:从字典中创建一个Series
要从字典中创建一个 Series,我们可以将字典的键用作索引,将字典的值用作数据,如下所示:
import pandas as pd
data = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
s = pd.Series(data)
print(s)
输出结果:
a 1
b 2
c 3
d 4
e 5
dtype: int64
输出结果中,Series 对象的索引是字典的键,数据是字典的值。
以上是使用 pd.Series() 函数创建 Series 的两种方法,可以根据自己的需求进行选择。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:python中pd.Series()函数的使用 - Python技术站