如何在Python中把pandas DataFrame转换成SQL

2023年3月27日下午3:30 • python-answer

把pandas DataFrame转换成SQL的过程可以通过pandas提供的to_sql方法来实现。下面是详细的攻略：

1. 连接数据库

在使用to_sql方法之前，我们需要先建立与数据库的连接。我们可以使用Python中的SQLAlchemy库（需要先安装）来建立连接。下面是示例代码：

from sqlalchemy import create_engine

engine = create_engine('mysql+pymysql://<username>:<password>@<host>:<port>/<database_name>')

其中，、、、和都需要根据实际情况进行替换。例如，如果要连接的是本地MySQL数据库，用户名为root，密码为123456，数据库名为test，则代码可以写成：

from sqlalchemy import create_engine

engine = create_engine('mysql+pymysql://root:123456@localhost:3306/test')

2. 将DataFrame转换为SQL表

由于pandas支持的数据类型比较多，而SQL支持的类型比较少，因此在将DataFrame转换成SQL表之前需要进行一些数据类型的转换。例如，pandas中日期类型的格式为datetime64，而在SQL中的日期类型为DATE 或者DATETIME。需要进行相应的转换。

import pandas as pd

# 创建一个DataFrame
df = pd.DataFrame({
        "name": ["Tom", "Jerry", "Mary", "John"],
        "age": [25, 30, 28, 32],
        "birthday": ["1995-05-18", "1990-04-01", "1992-06-15", "1988-09-10"]
    })

# 转换日期类型
df["birthday"] = pd.to_datetime(df["birthday"])

# 将DataFrame转换为SQL表
table_name = "person"
df.to_sql(table_name, con=engine, if_exists="replace", index=False)

在这里，我们先创建了一个DataFrame，其中包含了姓名、年龄和生日等信息。然后，我们使用pandas内置函数pd.to_datetime将"birthday"列转换为日期类型，以便在SQL中进行正确的存储。最后，我们使用to_sql方法将DataFrame转换为SQL表。其中，to_sql方法的第一个参数是目标表的名称，第二个参数是连接数据库的engine，if_exists参数用于指定表已经存在时的操作，index=False参数表示不保存索引。

3. 检查转换结果

转换完成后，我们可以使用SQLAlchemy提供的查询语句来检查结果是否正确。例如，我们可以查询person表中的记录：

# 查询person表
sql = "SELECT * FROM person"
result = pd.read_sql(sql, con=engine)
print(result)

输出结果如下：

   name  age   birthday
0   Tom   25 1995-05-18
1  Jerry  30 1990-04-01
2   Mary  28 1992-06-15
3   John  32 1988-09-10

从结果可以看出，DataFrame已经成功地转换成了SQL表。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：如何在Python中把pandas DataFrame转换成SQL - Python技术站

如何在Python中把pandas DataFrame转换成SQL

1. 连接数据库

2. 将DataFrame转换为SQL表

3. 检查转换结果

相关文章