Pandas是Python中非常常用的数据分析和处理库,可以很方便地完成各种操作。其中读取和保存数据的函数使用是比较常用的功能,下面就对Pandas常用的读取和保存数据的函数使用进行详细的讲解。
读取数据
读取csv文件
Pandas中用于读取csv文件的函数是read_csv()
,使用方法如下:
import pandas as pd
data = pd.read_csv('data.csv', encoding='utf-8')
其中data.csv
是要读取的文件路径,encoding
参数是指定编码方式,默认是utf-8
。
读取MySQL数据库
Pandas中用于读取MySQL数据库的函数是read_sql_query()
和read_sql_table()
,使用方法如下:
import pandas as pd
import pymysql
conn = pymysql.connect(host='localhost', user='root', password='123456', database='test', charset='utf8')
sql = 'select * from students'
data = pd.read_sql_query(sql, conn)
其中pymysql
是Python的MySQL数据库操作库,需要先安装;conn
是连接MySQL数据库的对象,需要提供MySQL的主机名、用户名、密码、数据库名、字符集等信息;sql
是要执行的查询语句,read_sql_query()
函数会根据该语句从MySQL中读取数据。
读取JSON文件
Pandas中用于读取JSON文件的函数是read_json()
,使用方法如下:
import pandas as pd
data = pd.read_json('data.json', encoding='utf-8')
其中data.json
是要读取的文件路径,encoding
参数是指定编码方式,默认是utf-8
。
读取Excel文件
Pandas中用于读取Excel文件的函数是read_excel()
,使用方法如下:
import pandas as pd
data = pd.read_excel('data.xlsx', sheet_name='Sheet1', encoding='utf-8')
其中data.xlsx
是要读取的Excel文件路径,sheet_name
参数是指定要读取的工作表名称,默认是第一个工作表,encoding
参数是指定编码方式,默认是utf-8
。
保存数据
保存为csv文件
Pandas中用于保存为csv文件的函数是to_csv()
,使用方法如下:
import pandas as pd
data = pd.read_csv('data.csv', encoding='utf-8')
data.to_csv('new_data.csv', index=False, encoding='utf-8')
其中new_data.csv
是要保存的文件路径,index
参数是指定是否保存索引列,默认是保存,encoding
参数是指定编码方式,默认是utf-8
。
保存到MySQL数据库
Pandas中用于保存到MySQL数据库的函数是to_sql()
,使用方法如下:
import pandas as pd
import pymysql
conn = pymysql.connect(host='localhost', user='root', password='123456', database='test', charset='utf8')
data = pd.read_csv('data.csv', encoding='utf-8')
data.to_sql('students', conn, index=False, if_exists='replace')
其中conn
是连接MySQL数据库的对象,students
是要保存到的表名,index
参数是指定是否保存索引列,默认是保存,if_exists
参数是指定如果表已存在时的处理方式,可以选择replace
(替换)或append
(追加)。
参考资料:
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Pandas常用的读取和保存数据的函数使用(csv,mysql,json,excel) - Python技术站