Pandas常用的读取和保存数据的函数使用(csv,mysql,json,excel)

Pandas是Python中非常常用的数据分析和处理库，可以很方便地完成各种操作。其中读取和保存数据的函数使用是比较常用的功能，下面就对Pandas常用的读取和保存数据的函数使用进行详细的讲解。

读取数据

读取csv文件

Pandas中用于读取csv文件的函数是read_csv()，使用方法如下：

import pandas as pd

data = pd.read_csv('data.csv', encoding='utf-8')

其中data.csv是要读取的文件路径，encoding参数是指定编码方式，默认是utf-8。

读取MySQL数据库

Pandas中用于读取MySQL数据库的函数是read_sql_query()和read_sql_table()，使用方法如下：

import pandas as pd
import pymysql

conn = pymysql.connect(host='localhost', user='root', password='123456', database='test', charset='utf8')
sql = 'select * from students'
data = pd.read_sql_query(sql, conn)

其中pymysql是Python的MySQL数据库操作库，需要先安装；conn是连接MySQL数据库的对象，需要提供MySQL的主机名、用户名、密码、数据库名、字符集等信息；sql是要执行的查询语句，read_sql_query()函数会根据该语句从MySQL中读取数据。

读取JSON文件

Pandas中用于读取JSON文件的函数是read_json()，使用方法如下：

import pandas as pd

data = pd.read_json('data.json', encoding='utf-8')

其中data.json是要读取的文件路径，encoding参数是指定编码方式，默认是utf-8。

读取Excel文件

Pandas中用于读取Excel文件的函数是read_excel()，使用方法如下：

import pandas as pd

data = pd.read_excel('data.xlsx', sheet_name='Sheet1', encoding='utf-8')

其中data.xlsx是要读取的Excel文件路径，sheet_name参数是指定要读取的工作表名称，默认是第一个工作表，encoding参数是指定编码方式，默认是utf-8。

保存数据

保存为csv文件

Pandas中用于保存为csv文件的函数是to_csv()，使用方法如下：

import pandas as pd

data = pd.read_csv('data.csv', encoding='utf-8')
data.to_csv('new_data.csv', index=False, encoding='utf-8')

其中new_data.csv是要保存的文件路径，index参数是指定是否保存索引列，默认是保存，encoding参数是指定编码方式，默认是utf-8。

保存到MySQL数据库

Pandas中用于保存到MySQL数据库的函数是to_sql()，使用方法如下：

import pandas as pd
import pymysql

conn = pymysql.connect(host='localhost', user='root', password='123456', database='test', charset='utf8')
data = pd.read_csv('data.csv', encoding='utf-8')
data.to_sql('students', conn, index=False, if_exists='replace')

其中conn是连接MySQL数据库的对象，students是要保存到的表名，index参数是指定是否保存索引列，默认是保存，if_exists参数是指定如果表已存在时的处理方式，可以选择replace（替换）或append（追加）。

参考资料：

Pandas官方文档

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：Pandas常用的读取和保存数据的函数使用(csv,mysql,json,excel) - Python技术站