Pandas常用的读取和保存数据的函数使用(csv,mysql,json,excel)

Pandas是Python中非常常用的数据分析和处理库,可以很方便地完成各种操作。其中读取和保存数据的函数使用是比较常用的功能,下面就对Pandas常用的读取和保存数据的函数使用进行详细的讲解。

读取数据

读取csv文件

Pandas中用于读取csv文件的函数是read_csv(),使用方法如下:

import pandas as pd

data = pd.read_csv('data.csv', encoding='utf-8')

其中data.csv是要读取的文件路径,encoding参数是指定编码方式,默认是utf-8

读取MySQL数据库

Pandas中用于读取MySQL数据库的函数是read_sql_query()read_sql_table(),使用方法如下:

import pandas as pd
import pymysql

conn = pymysql.connect(host='localhost', user='root', password='123456', database='test', charset='utf8')
sql = 'select * from students'
data = pd.read_sql_query(sql, conn)

其中pymysql是Python的MySQL数据库操作库,需要先安装;conn是连接MySQL数据库的对象,需要提供MySQL的主机名、用户名、密码、数据库名、字符集等信息;sql是要执行的查询语句,read_sql_query()函数会根据该语句从MySQL中读取数据。

读取JSON文件

Pandas中用于读取JSON文件的函数是read_json(),使用方法如下:

import pandas as pd

data = pd.read_json('data.json', encoding='utf-8')

其中data.json是要读取的文件路径,encoding参数是指定编码方式,默认是utf-8

读取Excel文件

Pandas中用于读取Excel文件的函数是read_excel(),使用方法如下:

import pandas as pd

data = pd.read_excel('data.xlsx', sheet_name='Sheet1', encoding='utf-8')

其中data.xlsx是要读取的Excel文件路径,sheet_name参数是指定要读取的工作表名称,默认是第一个工作表,encoding参数是指定编码方式,默认是utf-8

保存数据

保存为csv文件

Pandas中用于保存为csv文件的函数是to_csv(),使用方法如下:

import pandas as pd

data = pd.read_csv('data.csv', encoding='utf-8')
data.to_csv('new_data.csv', index=False, encoding='utf-8')

其中new_data.csv是要保存的文件路径,index参数是指定是否保存索引列,默认是保存,encoding参数是指定编码方式,默认是utf-8

保存到MySQL数据库

Pandas中用于保存到MySQL数据库的函数是to_sql(),使用方法如下:

import pandas as pd
import pymysql

conn = pymysql.connect(host='localhost', user='root', password='123456', database='test', charset='utf8')
data = pd.read_csv('data.csv', encoding='utf-8')
data.to_sql('students', conn, index=False, if_exists='replace')

其中conn是连接MySQL数据库的对象,students是要保存到的表名,index参数是指定是否保存索引列,默认是保存,if_exists参数是指定如果表已存在时的处理方式,可以选择replace(替换)或append(追加)。

参考资料:

Pandas官方文档

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas常用的读取和保存数据的函数使用(csv,mysql,json,excel) - Python技术站

(0)
上一篇 2023年5月14日
下一篇 2023年5月14日

相关文章

  • python中Array和DataFrame相互转换的实例讲解

    下面是详细的攻略: Python中Array和DataFrame相互转换的实例讲解 在Python中,Array和DataFrame是常用的数据结构。有时候我们需要将这两种数据结构相互转换,以便更好地处理数据。本文将详细讲解如何实现Array和DataFrame之间的转换,并给出具体的示例说明。 一、将Array转换成DataFrame 首先来看将Array…

    python 2023年5月14日
    00
  • Pandas描述性统计常用的方法

    什么是描述性统计? 描述统计学(descriptive statistics)是一门统计学领域的学科,是一种利用某些指标对数据进行概括和描述的一种统计方法。 描述性统计通过统计数据的集中趋势、离散程度、分布形态、相关性等特征来描述数据的基本情况和规律,常用于数据分析、数据挖掘、商业分析等领域。常见的描述性统计指标包括均值、中位数、标准差、方差、极差、四分位数…

    Pandas 2023年3月4日
    00
  • Pandas Python中数据帧的上限和下限–舍入和截断

    什么是数据帧的上限和下限? 在Pandas Python中,数据帧的上限和下限是指对数据框中的数值数据执行舍入或截断操作,从而将其舍入或截断为指定的精度、小数位数或指定的范围。 在 Pandas 中,有三种方法可以执行数据帧的上下限操作: round()函数:将数值舍入到指定的小数位数。 ceil()函数:将数值向上舍入到最接近的整数。 floor()函数:…

    python-answer 2023年3月27日
    00
  • 在Python 2.7即将停止支持时,我们为你带来了一份python 3.x迁移指南

    Python2.7停止支持与迁移指南 1. 为什么需要迁移? Python2.7将于2020年1月1日停止支持,维护期也于今年正式结束,这意味着Python 2.7已经不再更新,而且也很可能存在着一些无法修复的安全漏洞和性能问题。因此,迁移到Python 3.x版本是不可避免的。 2. Python2.7到Python3.x的主要变化 print语句变成了p…

    python 2023年5月14日
    00
  • 寻找Pandas数据框架列的四分位数和十分位数等级

    要寻找一个Pandas数据框架列的四分位数和十分位数等级,可以依次执行以下步骤: 1. 导入Pandas库 import pandas as pd 2. 创建数据框架 本次实例中,我们可以使用Seaborn库自带的Iris数据集作为示例数据,具体代码如下: import seaborn as sns iris = sns.load_dataset(‘iris…

    python-answer 2023年3月27日
    00
  • 浅谈Pandas中map, applymap and apply的区别

    浅谈Pandas中map、applymap和apply的区别 在Pandas中,我们通常会使用一些函数来对数据进行处理。其中,map、applymap和apply是经常使用的三个函数。尽管这三个函数可以实现类似的功能(在DataFrame或Series对象上应用一个函数并返回结果),但它们之间存在一些关键的区别,下面我将详细介绍这些区别,并给出一些示例说明。…

    python 2023年6月13日
    00
  • 按给定的比例随机分割一个Pandas数据框架

    按给定的比例随机分割一个Pandas数据框架的完整攻略如下: 首先,导入所需的库 import pandas as pd from sklearn.model_selection import train_test_split 加载数据集,这里以鸢尾花数据集为例 df = pd.read_csv(‘https://archive.ics.uci.edu/ml…

    python-answer 2023年3月27日
    00
  • 从Pandas的约会中获得一天的时间

    获取Pandas的约会数据集中的日期信息,可以通过以下几个步骤实现: 步骤1:导入Pandas和读取数据 import pandas as pd data = pd.read_csv(‘dating.csv’) 在这里,我们首先导入Pandas包,并读取数据集。 步骤2:将日期列转换为datetime格式 data[‘date’] = pd.to_datet…

    python-answer 2023年3月27日
    00
合作推广
合作推广
分享本页
返回顶部