使用SQLAlchemy将SQL数据库表读入Pandas DataFrame中

2023年3月27日下午12:14 • python-answer

在使用SQLAlchemy将SQL数据库表读入Pandas DataFrame之前，需要先安装SQLAlchemy和相应的数据库驱动程序。以MySQL为例，可以使用以下命令安装相关驱动程序和包：

pip install sqlalchemy
pip install pymysql
pip install pandas

在安装好所需的包后，可以按照以下步骤将SQL数据库表读入Pandas DataFrame中：

首先导入需要用到的包和模块，包括SQLAlchemy、pandas和对应数据库类型的驱动程序，以MySQL为例，使用的是pymysql。

import sqlalchemy
import pandas as pd
import pymysql

使用SQLAlchemy创建一个数据库连接对象，并连接到指定的数据库。在连接数据库时需要提供数据库的链接字符串，具体格式可以根据不同数据库类型进行调整。以MySQL为例，示例代码如下：

# 创建数据库连接
engine = sqlalchemy.create_engine("mysql+pymysql://username:password@host:port/dbname")

# 连接数据库，并返回结果集
with engine.connect() as conn:
   result = conn.execute("SELECT * FROM tableName")

# 将结果集读入Pandas DataFrame中
df = pd.DataFrame(result.fetchall(), columns=result.keys())

其中，username和password为数据库的登录名和密码，host为数据库的地址或IP，port为数据库端口号，dbname为需要连接的数据库名。tableName为需要读入的表名。

在连接成功后，使用连接对象的execute函数执行SQL语句，并将查询结果存储在result对象中。
将result对象中的查询结果读入Pandas DataFrame中，并指定DataFrame的列名。需要注意的是，result对象有keys()方法可以获得查询结果中各列的名称，应该作为DataFrame的columns参数的输入。

完整的示例代码如下：

import sqlalchemy
import pandas as pd
import pymysql

# 创建数据库连接
engine = sqlalchemy.create_engine("mysql+pymysql://username:password@host:port/dbname")

# 连接数据库，并返回结果集
with engine.connect() as conn:
    result = conn.execute("SELECT * FROM tableName")

# 将结果集读入Pandas DataFrame中，并指定列名
df = pd.DataFrame(result.fetchall(), columns=result.keys())

通过以上步骤，就可以使用SQLAlchemy将SQL数据库表读入Pandas DataFrame中了。需要注意的是，在实际代码中还需要添加一些异常处理和关闭数据库连接等代码，以确保程序的稳定性和可靠性。

本站文章如无特殊说明，均为本站原创，如若转载，请注明出处：使用SQLAlchemy将SQL数据库表读入Pandas DataFrame中 - Python技术站