Python Pandas学习之基本数据操作详解

Python Pandas学习之基本数据操作详解

基础知识

首先我们需要导入Pandas模块,并创建一个DataFrame对象:

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Lucy'], 'age': [20, 24, 22], 'score': [80, 78, 85]}
df = pd.DataFrame(data)

这个DataFrame包含了三列数据:name、age和score。我们可以通过以下方式读取这个DataFrame的基本信息:

# 查看前N行数据,默认为5
df.head()

# 查看数据类型
df.dtypes

# 查看数据维度
df.shape

# 查看每一列的统计信息
df.describe()

数据选择与过滤

我们可以通过以下方式选择和过滤数据:

# 选择一列
df['name']

# 选择多列
df[['name', 'age']]

# 选择特定行
df[1:2]

# 根据条件选择数据
df[df['age'] > 21]

数据排序

我们可以根据一列或多列对数据进行排序:

# 按照年龄从小到大排序
df.sort_values('age')

# 按照年龄从大到小排序
df.sort_values('age', ascending=False)

# 按照多列排序
df.sort_values(['age', 'score'], ascending=[True, False])

数据聚合

我们可以对数据进行聚合操作,例如计算平均值、总和等:

# 计算每一列的平均值
df.mean()

# 计算每一列的总和
df.sum()

# 计算每一行的平均值
df.mean(axis=1)

# 计算每一行中age值的最大值
df.groupby('name')['age'].max()

数据可视化

我们可以使用Pandas内置的绘图函数进行数据可视化:

# 绘制折线图
df.plot(kind='line', x='name', y='age')

# 绘制柱状图
df.plot(kind='bar', x='name', y='score')

# 绘制散点图
df.plot(kind='scatter', x='age', y='score')

示例说明

示例1:读取CSV文件并进行基本操作

import pandas as pd

# 读取csv文件
data = pd.read_csv('data.csv')

# 查看前10行数据
data.head(10)

# 查看数据类型
data.dtypes

# 查看数据维度
data.shape

# 根据条件选择数据
data[data['age'] > 30]

# 统计每个区域的平均年龄
data.groupby('region')['age'].mean()

# 绘制柱状图
data.groupby('region')['age'].mean().plot(kind='bar')

示例2:创建DataFrame并绘制散点图

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 创建DataFrame
data = pd.DataFrame({'x': np.random.rand(100), 'y': np.random.rand(100)})

# 绘制散点图
data.plot(kind='scatter', x='x', y='y')

# 显示图形
plt.show()

以上示例演示了如何读取CSV文件并进行基本操作,以及如何创建DataFrame并绘制散点图。更多Pandas的使用方法可以参考官方文档和其他相关资料。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python Pandas学习之基本数据操作详解 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • pandas 把数据写入txt文件每行固定写入一定数量的值方法

    Pandas 是一个流行的 Python 数据分析工具,在数据分析过程中,我们通常需要将分析结果保存成文件。Pandas 支持将数据保存到多种格式的文件中,包括 CSV、Excel、JSON、SQL、以及纯文本文件等。在本文中,我们将介绍如何使用 Pandas 将数据保存到纯文本文件,并控制每行写入的数据数量。 安装 Pandas 在开始之前,我们需要先安装…

    python 2023年6月13日
    00
  • 在pandas DataFrame中对行进行排序

    在pandas DataFrame中对行进行排序一般使用 sort_values 方法。下面是详细的操作步骤和实例说明: 1. 创建DataFrame 首先,我们需要创建一个DataFrame示例。这里我们使用 pandas 库自带的 read_csv 方法从csv文件中读取数据并创建DataFrame。 import pandas as pd df = p…

    python-answer 2023年3月27日
    00
  • pandas抽取行列数据的几种方法

    当我们使用pandas模块处理数据时,我们常常需要对数据进行抽取、筛选等操作。下面我将为大家介绍一些抽取行列数据的常用方法。 1. 通过标签名抽取列数据 我们可以使用[]和列的标签名来抽取列数据。例如: import pandas as pd data = {‘name’: [‘Alice’, ‘Bob’, ‘Charlie’, ‘David’, ‘Ella…

    python 2023年5月14日
    00
  • pandas学习之txt与sql文件的基本操作指南

    Pandas学习之txt与sql文件的基本操作指南 在Pandas中,我们可以使用read_csv()来读取.csv文件,但是如果我们需要读取其他格式的文件,该怎么办呢?本文将介绍如何使用Pandas来读取.txt和.sql文件,并进行基本的操作。 读取txt文件 我们可以使用read_table()方法来读取.txt文件。例如,我们有一个叫做sample.…

    python 2023年5月14日
    00
  • 如何从Pandas数据框架的多级列索引中删除一个级别

    如果我们在Pandas中创建了一个多级列索引的数据框架,但是想要删除其中的一个层级,可以按照以下步骤进行操作: 使用pandas的read_csv()方法读取数据文件,并指定header参数为None,以避免第一行被作为列名称 import pandas as pd df = pd.read_csv(‘data.csv’, header=None) 对于读取…

    python-answer 2023年3月27日
    00
  • 用Matplotlib在条形图上绘制Pandas数据框架的多列数据

    在Matplotlib中,我们可以使用bar()方法在条形图上绘制Pandas数据框架的多列数据。具体步骤如下: 首先,确保你已经导入了Matplotlib和Pandas模块: import matplotlib.pyplot as plt import pandas as pd 然后创建一个Pandas数据框架,包含你想要绘制的多列数据。例如: df = …

    python-answer 2023年3月27日
    00
  • Pandas中join和merge的区别是什么

    Pandas中join和merge都是用来将两个或多个数据集按照某些列或索引进行合并的函数。它们的主要区别如下: join是通过索引进行合并,而merge是通过列进行合并。 join只能用于两个数据集的合并,而merge可以合并两个或多个数据集。 join默认情况下是按照左连接进行合并,而merge默认情况下是按照内连接进行合并。 下面通过具体例子来演示jo…

    python-answer 2023年3月27日
    00
  • Python实现读取HTML表格 pd.read_html()

    当我们需要从HTML页面中读取表格数据进行进一步处理和分析时,Python中pd.read_html()函数是一个非常方便实用的方法。 1. pd.read_html()函数简介 pd.read_html()函数位于pandas模块中,可以直接从HTML页面中读取表格内容,并返回一个DataFrame类型的数据结构,可以直接用于进一步的数据处理和分析。 2.…

    python 2023年5月14日
    00
合作推广
合作推广
分享本页
返回顶部