Python3.5 Pandas模块之Series用法实例分析

介绍:

Pandas是一个Python第三方库,主要用于数据分析和处理,它是在NumPy基础上开发出来的,而且它的数据结构有Series和DataFrame,其中,Series是一种一维的数组,和数组最大的区别在于Series中每个数据都会有一个索引,这个索引可以默认的是从0开始生成,也可以自己定义,而Series中的数据必须是同一个数据类型。本文将详细使用实例的方式来讲解Pandas模块中Series的用法,以帮助读者更好地掌握这一数据结构。

一、Series对象的创建

Series对象的创建方法有多种,其中最常用的有:通过列表创建、通过字典创建、通过函数创建和通过NumPy数组创建,下面我们来依次介绍。

1.通过列表创建

Series对象的创建方法为:s = Series(data,index=index),其中data表示要创建的一维数组,index是对应的索引值,如果不指定,默认为从0开始的整数值。例如下面的代码创建了一个Series对象:

import pandas as pd
from pandas import Series

s = Series([16, 74, 86, 46])
print(s)

输出结果为:

0    16
1    74
2    86
3    46
dtype: int64

2.通过字典创建

Series对象的创建方法为:s = Series(data,index=index),其中data表示要创建的字典,index是对应的索引值,如果不指定,默认为字典中的键。例如下面的代码创建了一个Series对象:

import pandas as pd
from pandas import Series

d = {'A': 16, 'B': 74, 'C': 86, 'D': 46}
s = Series(d)
print(s)

输出结果为:

A    16
B    74
C    86
D    46
dtype: int64

3.通过函数创建

Series对象的创建方法为:s = Series(data,index=index),其中data表示通过函数生成的一维数组,index是对应的索引值。例如下面的代码创建了一个Series对象:

import pandas as pd
from pandas import Series

def func(n):
    return n ** 2

s = Series(func(10), index=range(10))
print(s)

输出结果为:

0      0
1      1
2      4
3      9
4     16
5     25
6     36
7     49
8     64
9     81
dtype: int64

4.通过NumPy数组创建

Series对象的创建方法为:s = Series(data,index=index),其中data表示通过NumPy数组生成的一维数组,index是对应的索引值。例如下面的代码创建了一个Series对象:

import pandas as pd
from pandas import Series
import numpy as np

n = np.array([16, 74, 86, 46])
s = Series(n)
print(s)

输出结果为:

0    16
1    74
2    86
3    46
dtype: int64

二、Series对象的属性和方法

Series对象有很多属性和方法,下面我们挑选其中的一些重要的进行详细介绍。

1.Series属性

• shape:返回一个元组,代表Series的形状

• size:返回Series中的值的总数

• index:返回Series的索引

• values:返回Series的值

例如下面的代码展示了这些属性的用法:

import pandas as pd
from pandas import Series
import numpy as np

n = np.array([16, 74, 86, 46])
s = Series(n)
print('n的形状:', n.shape)
print('s的形状:', s.shape)
print('s中的值的总数:', s.size)
print('s的索引:', s.index)
print('s的值:', s.values)

输出结果为:

n的形状: (4,)
s的形状: (4,)
s中的值的总数: 4
s的索引: RangeIndex(start=0, stop=4, step=1)
s的值: [16 74 86 46]

2.Series方法

• head():返回Series中的前n行,n默认是5

• tail():返回Series中的后n行,n默认是5

• describe():返回Series中的基本统计信息

• apply():应用一个函数

• sort_values():排序

例如下面的代码展示了这些方法的用法:

import pandas as pd
from pandas import Series
import numpy as np

n = np.array([16, 74, 86, 46])
s = Series(n)
print('s的前两个值:', s.head(2))
print('s的后两个值:', s.tail(2))
print('s的基本统计信息:', s.describe())
print('s的平方值:', s.apply(lambda x: x ** 2))
print('按值排序:', s.sort_values())

输出结果为:

s的前两个值: 0    16
1    74
dtype: int64
s的后两个值: 2    86
3    46
dtype: int64
s的基本统计信息: count     4.000000
mean     55.500000
std      31.003408
min      16.000000
25%      40.000000
50%      60.000000
75%      75.500000
max      86.000000
dtype: float64
s的平方值: 0     256
1    5476
2    7396
3    2116
dtype: int64
按值排序: 0    16
3    46
1    74
2    86
dtype: int64

三、示例说明

接下来我们会举两个使用Series的简单实例,让读者更好地理解它的用法。

1.对比两只股票的收盘价

下面我们分别获取A股和B股的每日收盘价,应用Series对象,求出A股和B股每日收盘价的平均值,并进行对比。

import pandas as pd
from pandas import Series

a_list = [15.5, 15.7, 16.0, 16.1, 15.9]
b_list = [13.9, 14.5, 14.8, 14.9, 14.7]

a = Series(a_list)
b = Series(b_list)

print('A股收盘价平均值:', round(a.mean(), 2))
print('B股收盘价平均值:', round(b.mean(), 2))

if a.mean() > b.mean():
    print('A股收盘价更高')
else:
    print('B股收盘价更高')

输出结果为:

A股收盘价平均值: 15.84
B股收盘价平均值: 14.56
A股收盘价更高

2.考试成绩分析

下面我们给出一组Python程序设计考试的成绩,应用Series对象,并使用describe()方法分析考试成绩。

import pandas as pd
from pandas import Series

score = [80, 86, 58, 95, 75, 68, 89, 92, 77, 83]

s = Series(score)
print(s.describe())

输出结果为:

count    10.000000
mean     81.300000
std      11.119627
min      58.000000
25%      75.250000
50%      81.500000
75%      88.250000
max      95.000000
dtype: float64

以上两个示例说明了Series在数据分析中的常见应用场景,利用Series对象可以很方便地进行数据的统计、分析和处理。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python3.5 Pandas模块之Series用法实例分析 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • Pandas div()函数的具体使用

    当我们需要对 Pandas 数据框的某一列进行除法运算时,就可以使用Pandas的 div() 函数。 div() 函数可以在 Pandas 数据框中的两个列之间执行除法运算。具体的使用方式为: df1.div(df2, fill_value=0) 其中 df1 是要进行除法操作的数据框,df2 则是用于除数的数据框。 如果两个数据框的列名不同,则需要选取对…

    python 2023年5月14日
    00
  • pandas中read_sql使用参数进行数据查询的实现

    pandas是一款强大的Python数据分析框架。read_sql是pandas框架中用于查询数据库数据并返回结果的函数之一。通过read_sql函数,可以轻松地将SQL语句转换为pandas DataFrame。本篇攻略将会详细讲解如何使用pandas中read_sql函数进行参数化的数据查询。 准备工作 在使用pandas中的read_sql函数进行数据…

    python 2023年5月14日
    00
  • 在Pandas中使用Timedelta和Period来创建基于DateTime的索引

    在Pandas中,可以使用Timedelta和Period来创建基于DateTime的索引。具体步骤如下: 1.导入Pandas和Numpy模块 import pandas as pd import numpy as np 2.生成时间序列数据 我们可以使用pd.date_range()函数来生成时间序列索引。其中可以指定起始时间、结束时间等参数,更多参数可…

    python-answer 2023年3月27日
    00
  • Pandas 数据库操作

    Pandas 是一个用于数据处理、分析和建模的 Python 库。它提供了数据结构和数据操作工具,可以很方便地处理和操作数据集,尤其适合于数据清洗和数据分析方面的工作。在 Pandas 中,使用 DataFrame 和 Series 这两种数据结构进行数据的处理和操作。 下面是一份 Pandas 数据库操作的完整攻略,包括数据读取、数据过滤、数据分组、数据合…

    python-answer 2023年3月27日
    00
  • 如何在Pandas数据框架中把整数转换为日期时间

    将整数转换为日期时间在Pandas数据框架中非常常见,下面是具体步骤: 导入必要的库 import pandas as pd from datetime import datetime, timedelta 假设我们有一个整形数据帧df,其中“日期”列是整数形式,表示从2000年1月1日以来的天数。我们将使用以下代码将其转换为日期时间: df[‘日期’] =…

    python-answer 2023年3月27日
    00
  • Python读写txt文本文件的操作方法全解析

    下面针对“Python读写txt文本文件的操作方法全解析”的攻略进行详细讲解。 1. 读取txt文件 Python读取txt文件可以使用Python的内置函数open(),此函数可以返回一个文件对象。 # 打开文件方式一 f = open(‘filename.txt’, ‘r’) # 打开文件方式二 with open(‘filename.txt’, ‘r’…

    python 2023年5月14日
    00
  • python3使用pandas获取股票数据的方法

    下面是关于“Python3使用Pandas获取股票数据的方法”的详细攻略: 步骤一:安装Pandas 在开始获取数据之前,必须先安装Pandas库。因为Pandas库提供了数据分析,读取和处理等功能,可以非常方便的获取和处理股票数据。 可以通过pip命令来安装Pandas库,具体的命令如下: pip install pandas 步骤二:导入必要的库 完成P…

    python 2023年5月14日
    00
  • pandas重复行删除操作df.drop_duplicates和df.duplicated的区别

    Pandas 是一种用于数据操作和分析的强大 Python 库。在数据分析的过程中,经常会遇到需要删除重复数据的情况。而 Pandas 提供了两种方法来删除重复行,即 df.drop_duplicates() 和 df.duplicated()。下面分别进行详细讲解: df.drop_duplicates() df.drop_duplicates(subse…

    python 2023年6月13日
    00
合作推广
合作推广
分享本页
返回顶部