我来为您详细讲解“Python中的pandas表格模块、文件模块和数据库模块”的实例教程。
简介
Pandas 是基于 NumPy 的一种数据分析工具,它提供了大量高效的数据操作工具和数据结构,被广泛应用于数据清洗、分析和可视化等领域。Pandas 中的核心数据结构是 DataFrame,类似于 Excel 表格,可以处理大量的不同类型的数据。同时,Pandas 还提供了丰富的 IO 工具,用于读写多种数据源,如 CSV 文件、Excel 文件、数据库等。
表格模块
示例 1 - 创建DataFrame
下面的示例展示了如何创建一个简单的 DataFrame。
import pandas as pd
data = {'name': ['Tom', 'Jerry', 'Spike'],
'age': [3, 5, 7],
'gender': ['M', 'M', 'F']}
df = pd.DataFrame(data)
print(df)
输出结果如下:
name age gender
0 Tom 3 M
1 Jerry 5 M
2 Spike 7 F
示例 2 - 读取CSV文件
下面的示例展示了如何读取一个 CSV 文件并创建 DataFrame。
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
输出结果如下:
name age gender
0 Tom 3 M
1 Jerry 5 M
2 Spike 7 F
文件模块
示例 1 - 将DataFrame写入CSV文件
下面的示例展示了如何将 DataFrame 写入到 CSV 文件中。
import pandas as pd
data = {'name': ['Tom', 'Jerry', 'Spike'],
'age': [3, 5, 7],
'gender': ['M', 'M', 'F']}
df = pd.DataFrame(data)
df.to_csv('data.csv', index=False)
这将会生成一个名为 data.csv 的文件,其内容为:
name,age,gender
Tom,3,M
Jerry,5,M
Spike,7,F
示例 2 - 读取Excel文件
下面的示例展示了如何读取一个 Excel 文件并创建 DataFrame。
import pandas as pd
df = pd.read_excel('data.xlsx')
print(df)
其中,data.xlsx 是一个包含数据的 Excel 文件。输出结果如下:
name age gender
0 Tom 3 M
1 Jerry 5 M
2 Spike 7 F
数据库模块
示例 1 - 从MySQL数据库读取数据
下面的示例展示了如何从 MySQL 数据库中读取数据并创建 DataFrame。
import pandas as pd
import pymysql
# 连接 MySQL 数据库
conn = pymysql.connect(
host='localhost',
port=3306,
user='root',
password='123456',
database='test',
charset='utf8mb4')
# 从表中读取数据
df = pd.read_sql('select * from users', con=conn)
# 关闭数据库连接
conn.close()
print(df)
这里假设我们在 MySQL 数据库中有一个名为 test 的数据库,其中包含一个名为 users 的表,其结构为:
+----+--------+-----+
| id | name | age |
+----+--------+-----+
| 1 | Tom | 3 |
| 2 | Jerry | 5 |
| 3 | Spike | 7 |
+----+--------+-----+
输出结果如下:
id name age
0 1 Tom 3
1 2 Jerry 5
2 3 Spike 7
示例 2 - 将DataFrame写入MySQL数据库
下面的示例展示了如何将 DataFrame 写入到 MySQL 数据库中。
import pandas as pd
import pymysql
# 连接 MySQL 数据库
conn = pymysql.connect(
host='localhost',
port=3306,
user='root',
password='123456',
database='test',
charset='utf8mb4')
# 创建DataFrame
data = {'name': ['Tom', 'Jerry', 'Spike'],
'age': [3, 5, 7],
'gender': ['M', 'M', 'F']}
df = pd.DataFrame(data)
# 将DataFrame写入MySQL数据库
df.to_sql('users', con=conn, if_exists='replace', index=False)
# 关闭数据库连接
conn.close()
这里将 DataFrame 写入 MySQL 数据库中的 users 表中。如果该表已经存在,则会被覆盖。
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:Python中的pandas表格模块、文件模块和数据库模块 - Python技术站