Pandas是Python语言中非常常用的数据处理和数据分析的库,其提供的数据结构包括了Series和DataFrame。本文我们将着重介绍Series这个数据结构的使用方法。
一、什么是Series
Series是一个带索引标签的一维数组,可以用来存储任意类型的相似或不相似的数据类型。在这个数据结构中,标签通常称为索引,它们对应于每个特定数据点。
二、创建Series对象
使用Pandas创建Series对象非常简单。可以使用一个列表,一个字典或一个NumPy数组来创建一个Series对象。下面分别介绍使用这三种方法创建Series对象的方法。
1、使用列表创建Series
当使用列表创建Series时,Series对象将采用索引0, 1, 2,...,n-1。您可以在创建Series时提供另一个列表来作为索引参数,这样您就可以自定义索引名称。
下面是一个简单的例子,演示如何通过列表创建Series对象:
import pandas as pd
# 列表创建Series
data = [10, 20, 30, 40, 50]
s = pd.Series(data)
print(s)
输出结果如下:
0 10
1 20
2 30
3 40
4 50
dtype: int64
2、使用字典创建Series
在使用字典创建Series时,字典键将用作Series对象的索引,并且字典值将用作Series对象的数据元素。
下面是一个简单的例子,演示如何通过字典创建Series对象:
import pandas as pd
# 字典创建Series
data = {'a':10, 'b':20, 'c':30, 'd':40, 'e':50}
s = pd.Series(data)
print(s)
输出结果如下:
a 10
b 20
c 30
d 40
e 50
dtype: int64
3、使用NumPy数组创建Series
在使用NumPy数组创建Series时,NumPy数组的元素将用作Series对象的数据元素。
下面是一个简单的例子,演示如何通过NumPy数组创建Series对象:
import pandas as pd
import numpy as np
# NumPy数组创建Series
data = np.array([10, 20, 30, 40, 50])
s = pd.Series(data)
print(s)
输出结果如下:
0 10
1 20
2 30
3 40
4 50
dtype: int64
三、Series常用方法
以下是Series对象中最常用的一些方法:
1、head() 和 tail()
head() 和 tail() 方法可以分别返回Series对象的前n行和后n行。如果没有指定n,则默认返回前5行。
import pandas as pd
# 创建Series
data = [10, 20, 30, 40, 50]
s = pd.Series(data)
print(s.head(2))
print(s.tail(2))
输出结果如下:
0 10
1 20
dtype: int64
3 40
4 50
dtype: int64
2、describe()
describe() 方法是一个统计方法,它计算Series对象中各列的快速统计信息,并以Series对象的形式返回这些统计信息。这些统计信息包括均值、标准差、最小值、最大值等等。
import pandas as pd
# 创建Series
data = [10, 20, 30, 40, 50]
s = pd.Series(data)
print(s.describe())
输出结果如下:
count 5.000000
mean 30.000000
std 15.811388
min 10.000000
25% 20.000000
50% 30.000000
75% 40.000000
max 50.000000
dtype: float64
3、iloc[] 和 loc[]
iloc[] 方法可用于从Series对象中按位置选择数据行。loc[] 方法可用于从Series对象中按索引选择数据行。
import pandas as pd
# 创建Series
data = {'a':10, 'b':20, 'c':30, 'd':40, 'e':50}
s = pd.Series(data)
print(s.iloc[2])
print(s.loc['c'])
输出结果如下:
30
30
四、总结
本文介绍了Pandas中Series这一数据结构的基本概念和创建方法,并且演示了Series对象的常用操作方法。通过学习本文,你将能够轻松创建、操作Series对象,掌握Series在数据分析和数据处理中的基本应用场景。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas数据结构之Series的使用 - Python技术站