Python中的pandas表格模块、文件模块和数据库模块

yizhihongxing

我来为您详细讲解“Python中的pandas表格模块、文件模块和数据库模块”的实例教程。

简介

Pandas 是基于 NumPy 的一种数据分析工具,它提供了大量高效的数据操作工具和数据结构,被广泛应用于数据清洗、分析和可视化等领域。Pandas 中的核心数据结构是 DataFrame,类似于 Excel 表格,可以处理大量的不同类型的数据。同时,Pandas 还提供了丰富的 IO 工具,用于读写多种数据源,如 CSV 文件、Excel 文件、数据库等。

表格模块

示例 1 - 创建DataFrame

下面的示例展示了如何创建一个简单的 DataFrame。

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Spike'], 
        'age': [3, 5, 7], 
        'gender': ['M', 'M', 'F']}

df = pd.DataFrame(data)

print(df)

输出结果如下:

    name  age gender
0    Tom    3     M
1  Jerry    5     M
2  Spike    7     F

示例 2 - 读取CSV文件

下面的示例展示了如何读取一个 CSV 文件并创建 DataFrame。

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

输出结果如下:

    name  age gender
0    Tom    3     M
1  Jerry    5     M
2  Spike    7     F

文件模块

示例 1 - 将DataFrame写入CSV文件

下面的示例展示了如何将 DataFrame 写入到 CSV 文件中。

import pandas as pd

data = {'name': ['Tom', 'Jerry', 'Spike'], 
        'age': [3, 5, 7], 
        'gender': ['M', 'M', 'F']}

df = pd.DataFrame(data)

df.to_csv('data.csv', index=False)

这将会生成一个名为 data.csv 的文件,其内容为:

name,age,gender
Tom,3,M
Jerry,5,M
Spike,7,F

示例 2 - 读取Excel文件

下面的示例展示了如何读取一个 Excel 文件并创建 DataFrame。

import pandas as pd

df = pd.read_excel('data.xlsx')

print(df)

其中,data.xlsx 是一个包含数据的 Excel 文件。输出结果如下:

    name  age gender
0    Tom    3     M
1  Jerry    5     M
2  Spike    7     F

数据库模块

示例 1 - 从MySQL数据库读取数据

下面的示例展示了如何从 MySQL 数据库中读取数据并创建 DataFrame。

import pandas as pd
import pymysql

# 连接 MySQL 数据库
conn = pymysql.connect(
    host='localhost',
    port=3306,
    user='root',
    password='123456',
    database='test',
    charset='utf8mb4')

# 从表中读取数据
df = pd.read_sql('select * from users', con=conn)

# 关闭数据库连接
conn.close()

print(df)

这里假设我们在 MySQL 数据库中有一个名为 test 的数据库,其中包含一个名为 users 的表,其结构为:

+----+--------+-----+
| id | name   | age |
+----+--------+-----+
|  1 | Tom    |   3 |
|  2 | Jerry  |   5 |
|  3 | Spike  |   7 |
+----+--------+-----+

输出结果如下:

   id   name  age
0   1    Tom    3
1   2  Jerry    5
2   3  Spike    7

示例 2 - 将DataFrame写入MySQL数据库

下面的示例展示了如何将 DataFrame 写入到 MySQL 数据库中。

import pandas as pd
import pymysql

# 连接 MySQL 数据库
conn = pymysql.connect(
    host='localhost',
    port=3306,
    user='root',
    password='123456',
    database='test',
    charset='utf8mb4')

# 创建DataFrame
data = {'name': ['Tom', 'Jerry', 'Spike'], 
        'age': [3, 5, 7], 
        'gender': ['M', 'M', 'F']}
df = pd.DataFrame(data)

# 将DataFrame写入MySQL数据库
df.to_sql('users', con=conn, if_exists='replace', index=False)

# 关闭数据库连接
conn.close()

这里将 DataFrame 写入 MySQL 数据库中的 users 表中。如果该表已经存在,则会被覆盖。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python中的pandas表格模块、文件模块和数据库模块 - Python技术站

(0)
上一篇 2023年5月13日
下一篇 2023年5月13日

相关文章

  • Python OOP类中的几种函数或方法总结

    Python OOP(面向对象编程)中,类是重中之重。类的属性和方法是类的重要组成部分。类中定义的方法可以是实例方法、静态方法或类方法。下面对这三种方法进行详细讲解: 实例方法 实例方法是最常用的方法,这种方法在类中被定义时第一个参数必须是self。 self代表类的实例,而不是类。 self是一个指针,它指向当前实例的地址,可以通过self访问类的变量。 …

    python 2023年6月5日
    00
  • Python爬虫PyQuery库基本用法入门教程

    我来为你讲解一下“Python爬虫PyQuery库基本用法入门教程”的完整攻略。 1. PyQuery库介绍 1.1 PyQuery库是什么 PyQuery库是Python中一个类似于jQuery的库,它能够使用类似于jQuery中的语法来解析和操作HTML文档,使得Python爬虫的开发变得更加方便。 1.2 PyQuery库的安装方法 可以使用pip命令…

    python 2023年5月14日
    00
  • python3.6.5基于kerberos认证的hive和hdfs连接调用方式

    下面是介绍“python3.6.5基于kerberos认证的hive和hdfs连接调用方式”的攻略: 环境准备 安装Kerberos 在Linux上安装Kerberos,可以使用以下命令: sudo apt-get install krb5-user 配置Kerberos 对于不同的Kerberos配置文件,具体的修改可能会不同,具体修改方式可以参考官方文档…

    python 2023年6月6日
    00
  • python 如何上传包到pypi

    上传Python包到PyPI是Python开发中非常重要的一步,这意味着开发者可以在全球范围内共享他们的Python包。下面是如何上传Python包到PyPI的完整攻略。 1. 创建项目文件夹 首先,我们需要为Python包创建一个项目文件夹,在项目文件夹中包含以下文件: project_folder ├── README.md ├── LICENSE ├─…

    python 2023年5月14日
    00
  • 在Mac下使用python实现简单的目录树展示方法

    当我们需要处理大量文件,或者需要深入分析文件系统时,常常需要在终端查看文件的完整路径和目录结构。在Mac上,可以使用Python实现简单的目录树展示方法来方便快速的实现这个功能。 下面是使用Python实现简单的目录树展示方法的步骤: 1. 安装tree命令 使用brew命令来安装tree命令: brew install tree 2. 创建Python脚本…

    python 2023年6月2日
    00
  • python实现提取str字符串/json中多级目录下的某个值

    提取多级目录下的值是Python处理字符串和JSON数据的常见需求。下面是一些步骤,可以让你实现该功能。 将字符串或JSON数据转换为Python对象 如果你要从字符串中提取值,可以使用Python内置的字符串方法来加载它,例如json.loads。如果你已经有一个JSON数据,你可以使用Python的json库来加载它。你可以使用以下代码来加载JSON数据…

    python 2023年6月3日
    00
  • 结合Python网络爬虫做一个今日新闻小程序

    在本攻略中,我们将介绍如何结合Python网络爬虫做一个今日新闻小程序。以下是一个完整攻略,包括两个示例。 步骤1:确定目标网站 首先,我们需要确定目标网站,以便爬取今日新闻。我们可以使用Python的requests库来获取网页内容,使用BeautifulSoup库来解析HTML文档。 步骤2:分析网页结构 接下来,我们需要分析目标网站的网页结构,以便确定…

    python 2023年5月15日
    00
  • 在 python 3.4.7 的 pool.map 函数中添加额外的随机参数作为参数

    【问题标题】:Adding additional random parameter as an argument in pool.map function in python 3.4.7在 python 3.4.7 的 pool.map 函数中添加额外的随机参数作为参数 【发布时间】:2023-04-06 07:02:01 【问题描述】: 我想在大型数据集上…

    Python开发 2023年4月7日
    00
合作推广
合作推广
分享本页
返回顶部