python 用pandas实现数据透视表功能

2023年5月14日上午11:36 • python

yizhihongxing

当我们需要对数据进行汇总和分组统计时，数据透视表是一个非常方便的工具。在Python中，使用pandas库可以很方便地实现数据透视表功能。下面是详细的攻略：

步骤一：导入pandas库

首先需要导入pandas库：

import pandas as pd

步骤二：读取数据

接下来需要读取数据。如果数据已经存放在文件中，可以使用pandas的read_csv方法读取：

data = pd.read_csv('data.csv')

这里我们假设数据存放在了名为data.csv的文件中。

步骤三：创建数据透视表

接下来可以创建数据透视表了。首先需要选择用哪些列进行汇总：

pivot = pd.pivot_table(data, values='Sales', index='Region', columns='Product', aggfunc='sum')

这里我们选择按照Region和Product列进行汇总，并且使用sum方法进行汇总计算。Sales列的数据将会出现在汇总结果中。

步骤四：查看结果

最后需要查看结果。可以使用以下代码进行查看：

print(pivot)

该代码会输出汇总结果。

示例一

假设我们有以下数据：

Region,Product,Sales
West,Apples,20
West,Oranges,30
East,Apples,15
East,Oranges,25

我们可以使用以下代码创建数据透视表：

import pandas as pd

data = pd.read_csv('data.csv')

pivot = pd.pivot_table(data, values='Sales', index='Region', columns='Product', aggfunc='sum')

print(pivot)

结果将会是：

Product  Apples  Oranges
Region                 
East        15       25
West        20       30

示例二

假设我们有以下数据：

Region,Product,Sales,Cost
West,Apples,20,10
West,Oranges,30,15
East,Apples,15,8
East,Oranges,25,12

我们可以使用以下代码创建数据透视表：

import pandas as pd

data = pd.read_csv('data.csv')

pivot = pd.pivot_table(data, values=['Sales', 'Cost'], index='Region', columns='Product', aggfunc='sum')

print(pivot)

结果将会是：

          Cost         Sales      
Product Apples Oranges Apples Oranges
Region                               
East         8      12     15      25
West        10      15     20      30

可以看到，我们不仅可以汇总Sales列的数据，还可以同时汇总Cost列的数据。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：python 用pandas实现数据透视表功能 - Python技术站

赞 (3)

微信扫一扫

微信扫一扫

支付宝扫一扫

支付宝扫一扫

Python基于pandas实现json格式转换成dataframe的方法

上一篇 2023年5月14日

Python基础之教你怎么在M1系统上使用pandas

下一篇 2023年5月14日

从Pandas DataFrame中获取列标题列表

获取Pandas DataFrame中的列标题列表可以使用.columns属性。下面是完整的攻略：步骤一：导入Pandas库在代码之前，需要先导入Pandas库。使用以下代码进行导入： import pandas as pd 步骤二：创建DataFrame 为了演示如何获取Pandas DataFrame中的列标题列表，需要先创建一个DataFrame。…

python-answer 2023年3月27日
001
使用Pandas模块串联CSV文件

使用Pandas模块可以非常方便地读取、处理、分析CSV文件，同时也支持串联多个CSV文件。下面是使用Pandas模块串联CSV文件的完整攻略： 1. 导入Pandas模块首先要导入Pandas模块，可以使用以下代码： import pandas as pd 2. 读取CSV文件使用Pandas模块读取CSV文件非常简单，可以使用pd.read_csv(…

python-answer 2023年3月27日
000
如何使用Pandas的Quantile打印系列中超过75%的数值

使用Pandas的Quantile方法可以轻松地对数据进行分位数切割，从而对数据中的各个百分位数进行分析。下面是如何使用Pandas的Quantile打印系列中超过75%的数值的完整攻略。准备数据首先我们需要准备一组数据，在这里我们使用Pandas内置的数据集”titanic”作为例子。我们首先导入必要的库，然后使用Pandas的read_csv方法读取…

python-answer 2023年3月27日
001
在Pandas中对数据框架的浮动列进行格式化

在Pandas中对数据框架的浮动列进行格式化，可以使用applymap()函数和Styler类。首先，我们创建一个数据框架： import pandas as pd import numpy as np data = pd.DataFrame(np.random.rand(5, 5), columns=[‘A’, ‘B’, ‘C’, ‘D’, ‘E’]) …

python-answer 2023年3月27日
001
python中isoweekday和weekday的区别及说明

当我们使用Python中的datetime模块进行日期处理时，常常会用到weekday()和isoweekday()两个函数。虽然这两个函数都可以用于获取日期是一周中的星期几，但是它们之间确实有些区别。下面我们就来详细讲解一下它们的区别及说明。 weekday()函数 weekday()函数返回日期值是星期几，其中星期一为0，星期日为6。以下是weekday…

python 2023年5月14日
000
Python3.5 Pandas模块之Series用法实例分析

介绍： Pandas是一个Python第三方库，主要用于数据分析和处理，它是在NumPy基础上开发出来的，而且它的数据结构有Series和DataFrame，其中，Series是一种一维的数组，和数组最大的区别在于Series中每个数据都会有一个索引，这个索引可以默认的是从0开始生成，也可以自己定义，而Series中的数据必须是同一个数据类型。本文将详细使用…

python 2023年5月14日
000
Python 将嵌套的字典列表转换成Pandas数据框架

将嵌套的字典列表转换成Pandas数据框架是Pandas中常用的数据预处理技巧之一。下面是详细的攻略：准备数据先准备一个嵌套的字典列表，例如： data = [ { ‘name’: ‘Alice’, ‘age’: 25, ‘skills’: [‘Python’, ‘Java’, ‘SQL’], ‘contact’: { ’email’: ‘alice@e…

python-answer 2023年3月27日
000
Python中的Pandas分析

Pandas是Python中一款流行的数据分析工具，它提供了高效的数据结构和数据分析工具，使得数据分析变得更加简单和可靠。Pandas主要包含两种数据结构：Series和DataFrame。 Series Series是Pandas中的一种一维数组，可以看作是数组和字典的混合体。第一列是索引，第二列是值。Series可以使用多种方式构建： import pa…

python-answer 2023年3月27日
000

合作推广

合作推广

返回顶部