Pandas数据结构之Series的使用

Pandas是Python语言中非常常用的数据处理和数据分析的库，其提供的数据结构包括了Series和DataFrame。本文我们将着重介绍Series这个数据结构的使用方法。

一、什么是Series

Series是一个带索引标签的一维数组，可以用来存储任意类型的相似或不相似的数据类型。在这个数据结构中，标签通常称为索引，它们对应于每个特定数据点。

二、创建Series对象

使用Pandas创建Series对象非常简单。可以使用一个列表，一个字典或一个NumPy数组来创建一个Series对象。下面分别介绍使用这三种方法创建Series对象的方法。

1、使用列表创建Series

当使用列表创建Series时，Series对象将采用索引0, 1, 2，...，n-1。您可以在创建Series时提供另一个列表来作为索引参数，这样您就可以自定义索引名称。

下面是一个简单的例子，演示如何通过列表创建Series对象：

import pandas as pd

# 列表创建Series
data = [10, 20, 30, 40, 50]
s = pd.Series(data)

print(s)

输出结果如下：

0    10
1    20
2    30
3    40
4    50
dtype: int64

2、使用字典创建Series

在使用字典创建Series时，字典键将用作Series对象的索引，并且字典值将用作Series对象的数据元素。

下面是一个简单的例子，演示如何通过字典创建Series对象：

import pandas as pd

# 字典创建Series
data = {'a':10, 'b':20, 'c':30, 'd':40, 'e':50}
s = pd.Series(data)

print(s)

输出结果如下：

a    10
b    20
c    30
d    40
e    50
dtype: int64

3、使用NumPy数组创建Series

在使用NumPy数组创建Series时，NumPy数组的元素将用作Series对象的数据元素。

下面是一个简单的例子，演示如何通过NumPy数组创建Series对象：

import pandas as pd
import numpy as np

# NumPy数组创建Series
data = np.array([10, 20, 30, 40, 50])
s = pd.Series(data)

print(s)

输出结果如下：

0    10
1    20
2    30
3    40
4    50
dtype: int64

三、Series常用方法

以下是Series对象中最常用的一些方法：

1、head() 和 tail()

head() 和 tail() 方法可以分别返回Series对象的前n行和后n行。如果没有指定n，则默认返回前5行。

import pandas as pd

# 创建Series
data = [10, 20, 30, 40, 50]
s = pd.Series(data)

print(s.head(2))
print(s.tail(2))

输出结果如下：

0    10
1    20
dtype: int64
3    40
4    50
dtype: int64

2、describe()

describe() 方法是一个统计方法，它计算Series对象中各列的快速统计信息，并以Series对象的形式返回这些统计信息。这些统计信息包括均值、标准差、最小值、最大值等等。

import pandas as pd

# 创建Series
data = [10, 20, 30, 40, 50]
s = pd.Series(data)

print(s.describe())

输出结果如下：

count     5.000000
mean     30.000000
std      15.811388
min      10.000000
25%      20.000000
50%      30.000000
75%      40.000000
max      50.000000
dtype: float64

3、iloc[] 和 loc[]

iloc[] 方法可用于从Series对象中按位置选择数据行。loc[] 方法可用于从Series对象中按索引选择数据行。

import pandas as pd

# 创建Series
data = {'a':10, 'b':20, 'c':30, 'd':40, 'e':50}
s = pd.Series(data)

print(s.iloc[2])
print(s.loc['c'])

输出结果如下：

30
30

四、总结

本文介绍了Pandas中Series这一数据结构的基本概念和创建方法，并且演示了Series对象的常用操作方法。通过学习本文，你将能够轻松创建、操作Series对象，掌握Series在数据分析和数据处理中的基本应用场景。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Pandas数据结构之Series的使用 - Python技术站

Pandas数据结构之Series的使用

一、什么是Series

二、创建Series对象

1、使用列表创建Series

2、使用字典创建Series

3、使用NumPy数组创建Series

三、Series常用方法

1、head() 和 tail()

2、describe()

3、iloc[] 和 loc[]

四、总结

相关文章