Pandas-DataFrame知识点汇总

Pandas-DataFrame知识点汇总

什么是DataFrame

DataFrame是Pandas中最强大的数据结构之一。它可以看作是由Series组成的表格。DataFrame中的每列称为一个Series,而行则表示表格中的观察。以下是创建DataFrame的一种方法:

import pandas as pd

data = {
    'name': ['Alice', 'Bob', 'Charlie', 'David'],
    'age': [25, 32, 18, 47],
    'occupation': ['student', 'engineer', 'salesman', 'artist']
}

df = pd.DataFrame(data)
print(df)

输出结果:

       name  age occupation
0     Alice   25    student
1       Bob   32   engineer
2   Charlie   18   salesman
3     David   47     artist

DataFrame的基本操作

选择子集

您可以使用.loc方法选择DataFrame的子集。

# 选择一列
print(df.loc[:, 'name'])

# 选择多列
print(df.loc[:, ['name', 'age']])

# 选择多行
print(df.loc[0:2, :])

# 选择满足条件的行
print(df[df['age'] > 30])

输出结果:

0       Alice
1         Bob
2     Charlie
3       David
Name: name, dtype: object

       name  age
0     Alice   25
1       Bob   32
2   Charlie   18
3     David   47

      name  age occupation
0    Alice   25    student
1      Bob   32   engineer
2  Charlie   18   salesman

    name  age occupation
1    Bob   32   engineer
3  David   47     artist

新加一列

可以使用下面的方法给DataFrame添加新的一列:

df['gender'] = ['F', 'M', 'M', 'M']
print(df)

输出结果:

       name  age occupation gender
0     Alice   25    student      F
1       Bob   32   engineer      M
2   Charlie   18   salesman      M
3     David   47     artist      M

实例说明

示例1:统计和绘图

假设您有一个保存有每个城市人口数据的DataFrame,您可以使用DataFrame的统计和绘图功能计算和可视化各个城市的人口数据。

import pandas as pd
import matplotlib.pyplot as plt

# 读取人口数据
pop = pd.read_csv('populations.csv')

# 计算各个城市的总人口
pop_by_city = pop.groupby('City')['Population'].sum()

# 绘制柱状图
pop_by_city.plot(kind='bar')
plt.xlabel('City')
plt.ylabel('Population')
plt.show()

示例2:简单的数据清理

假设您有一个保存有学生成绩数据的DataFrame。您可以使用DataFrame的数据清理功能,消除噪声并填充缺失值。

import pandas as pd

# 读取成绩数据
scores = pd.read_csv('scores.csv')

# 删除成绩为负数的行
scores = scores[scores['score'] >= 0]

# 填充缺失值
scores = scores.fillna({'name': 'Unknown', 'age': 0})

结论

这里只是介绍了一些DataFrame的基本用法。DataFrame提供了更多的数据操作功能,如合并、分组、透视等。可以通过阅读Pandas文档来了解更多。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas-DataFrame知识点汇总 - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • pandas数据分组和聚合操作方法

    下面是关于“pandas数据分组和聚合操作方法”的完整攻略。 1. 前置基础知识 在进行数据分组和聚合操作前,我们需要掌握以下基础知识: pandas的数据结构Series和DataFrame; pandas中的GroupBy对象,用于进行数据分组操作; 聚合操作中的常用函数,包括sum、mean、count等; apply方法的使用,可以对数据进行自定义操…

    python 2023年5月14日
    00
  • 如何用Python合并一个文件夹中的所有excel文件

    首先,你需要导入以下Python库:- os:使用该库来访问并处理文件和文件夹。- pandas:使用该库来处理Excel文件。 接下来,你可以使用下面的代码来合并一个文件夹中的所有Excel文件: import os import pandas as pd # 设置文件夹路径 folder_path = "Folder Path" # …

    python-answer 2023年3月27日
    00
  • 教你使用Python根据模板批量生成docx文档

    教你使用Python根据模板批量生成docx文档 简介 docx是Microsoft Word的文档格式,使用Python可以根据给定模板批量生成docx文档。本文将会介绍如何使用Python进行docx文件的自动化生成。 安装所需模块 在进行下一步之前,需要安装以下模块: docx:处理docx文件格式的Python库。可通过这个链接进行安装。 pip i…

    python 2023年6月14日
    00
  • pandas数据处理进阶详解

    pandas数据处理进阶详解 1. pandas简介 pandas是一个强大的Python数据分析工具包,可以轻松地处理和分析各种类型的数据。pandas主要有两个数据结构:Series(序列)和DataFrame(数据框),可以在数据处理和数据分析中灵活运用。更多关于pandas的知识,可以查看官方文档:https://pandas.pydata.org/…

    python 2023年5月14日
    00
  • python实现批量提取指定文件夹下同类型文件

    当我们需要批量处理一个文件夹下的多个文件时,可以使用Python来快速实现。下面是实现提取指定类型文件的步骤: 1. 利用os模块获取指定文件夹下所有文件的路径 首先需要导入os模块,使用os.listdir(path)方法来获取指定路径下的所有文件列表。可以使用以下代码获取指定路径下所有文件的路径: import os path = ‘./files’ #…

    python 2023年6月13日
    00
  • Pandas的系统取样

    Pandas是一个Python语言编写的数据框架,它提供了一些非常方便的系统取样方法。在数据分析中,有时候需要从数据集中随机抽取一部分数据进行分析,系统取样就是一种常用的方法。 Pandas提供了以下几种系统取样方法: .sample(n=None, frac=None, replace=False, weights=None, random_state=N…

    python-answer 2023年3月27日
    00
  • Python3.5 Pandas模块之Series用法实例分析

    介绍: Pandas是一个Python第三方库,主要用于数据分析和处理,它是在NumPy基础上开发出来的,而且它的数据结构有Series和DataFrame,其中,Series是一种一维的数组,和数组最大的区别在于Series中每个数据都会有一个索引,这个索引可以默认的是从0开始生成,也可以自己定义,而Series中的数据必须是同一个数据类型。本文将详细使用…

    python 2023年5月14日
    00
  • 在Pandas中为现有的DataFrame添加新列

    为现有的DataFrame添加新列的过程可以通过Pandas中的assign()方法来实现,该方法可以直接在原始DataFrame基础上添加新的列,并返回一个具有新列的新DataFrame。下面是详细的攻略: 创建一个DataFrame 首先,我们需要创建一个示例DataFrame来演示如何添加新列。在本例中,我们将创建一个包含“姓名”和“年龄”的简单Dat…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部