下面我来详细讲解一下“Python中八种数据导入方法总结”的完整实例教程。
介绍
数据导入是数据分析的第一步,Python中有多种数据导入方法,本文将总结Python中的八种常用数据导入方法,并通过示例演示其使用。
方法一:使用read_csv()函数读取CSV文件
CSV文件是一种常见的数据格式,使用pandas库的read_csv()函数可以快速读取CSV文件。
示例代码:
import pandas as pd
# 读取csv文件
data = pd.read_csv('data.csv')
print(data.head())
方法二:使用read_excel()函数读取Excel文件
Excel文件是另一种常见的数据格式,pandas库的read_excel()函数可以快速读取Excel文件。
示例代码:
import pandas as pd
# 读取Excel文件
data = pd.read_excel('data.xlsx')
print(data.head())
方法三:使用pd.read_sql_query()函数读取SQL数据库中的数据
pandas库的pd.read_sql_query()函数可以用来读取SQL数据库中的数据。
示例代码:
import pandas as pd
import sqlite3
# 连接到数据库
conn = sqlite3.connect('test.db')
# SQL查询语句
sql = "SELECT * FROM data"
# 读取数据
data = pd.read_sql_query(sql, conn)
print(data.head())
方法四:使用pd.read_html()函数读取网页数据
pandas库的pd.read_html()函数可以用来读取网页数据,它会返回一个包含所有HTML表格的列表,我们可以通过索引访问其中的单个表格。
示例代码:
import pandas as pd
# 读取网页
url = 'http://www.example.com'
data_list = pd.read_html(url)
# 获取第一个表格
data = data_list[0]
print(data.head())
方法五:使用csv模块手动读取CSV文件
除了使用pandas库的read_csv()函数之外,还可以使用csv模块手动读取CSV文件。
示例代码:
import csv
# 打开CSV文件
with open('data.csv', 'r') as f:
reader = csv.reader(f)
data = [row for row in reader]
print(data[:5])
方法六:使用xlrd和xlwt模块手动读取和写入Excel文件
如果不想使用pandas库,也可以使用xlrd和xlwt模块手动读取和写入Excel文件。
示例代码:
import xlrd
import xlwt
# 打开Excel文件
workbook = xlrd.open_workbook('data.xlsx')
# 获取第一个工作表
worksheet = workbook.sheet_by_index(0)
# 读取数据
data = []
for i in range(1, worksheet.nrows):
row_data = []
for j in range(worksheet.ncols):
cell_data = worksheet.cell_value(i, j)
row_data.append(cell_data)
data.append(row_data)
# 写入Excel文件
new_workbook = xlwt.Workbook()
new_worksheet = new_workbook.add_sheet('Sheet1')
for i, row_data in enumerate(data):
for j, cell_data in enumerate(row_data):
new_worksheet.write(i, j, cell_data)
new_workbook.save('new_data.xlsx')
方法七:使用MySQLdb模块读取MySQL数据库中的数据
除了pd.read_sql_query()函数之外,还可以使用MySQLdb模块来读取MySQL数据库中的数据。
示例代码:
import MySQLdb
# 连接到MySQL数据库
db = MySQLdb.connect(host='localhost', user='root', passwd='123456', db='test')
# 获取游标
cursor = db.cursor()
# SQL查询语句
sql = "SELECT * FROM data"
# 执行SQL语句
cursor.execute(sql)
# 获取数据
data = cursor.fetchall()
print(data[:5])
# 关闭游标和数据库连接
cursor.close()
db.close()
方法八:使用pyodbc模块读取SQL Server数据库中的数据
pyodbc是一个Python库,可以用来连接SQL Server数据库。使用pyodbc模块可以读取SQL Server数据库中的数据。
示例代码:
import pyodbc
# 连接到SQL Server数据库
cnxn = pyodbc.connect('DRIVER={SQL Server};SERVER=localhost;DATABASE=test;UID=sa;PWD=123456')
# 获取游标
cursor = cnxn.cursor()
# SQL查询语句
sql = "SELECT * FROM data"
# 执行SQL语句
cursor.execute(sql)
# 获取数据
data = cursor.fetchall()
print(data[:5])
# 关闭游标和数据库连接
cursor.close()
cnxn.close()
以上就是Python中八种数据导入方法的总结。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python中八种数据导入方法总结 - Python技术站