pd.read_sql()知道这些就够用了

最新推荐文章于 2025-06-19 13:56:36 发布

原创最新推荐文章于 2025-06-19 13:56:36 发布 · 7.1w 阅读

105 ·

CC 4.0 BY-SA版权

文章标签：

#read_sql #sqlalchemy #pymysql

SQL || HDF || Mongo 专栏收录该内容

65 篇文章

订阅专栏

本文详细介绍了如何使用Pandas的read_sql函数从SQL数据库读取数据，包括参数解析、数据库连接创建方法及与read_sql_table、read_sql_query的区别。涵盖了SQLAlchemy和DBAPI两种数据库链接方式。

该文章已生成可运行项目，

pandas.read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=None, chunksize=None)

各参数意义
- sql:SQL命令字符串
- con：连接sql数据库的engine，一般可以用SQLalchemy或者pymysql之类的包建立
- index_col: 选择某一列作为index
- coerce_float:非常有用，将数字形式的字符串直接以float型读入
- parse_dates:将某一列日期型字符串转换为datetime型数据，与pd.to_datetime函数功能类似。可以直接提供需要转换的列名以默认的日期形式转换，也可以用字典的格式提供列名和转换的日期格式，比如{column_name: format string}（format string："%Y:%m:%H:%M:%S"）。
- columns:要选取的列。一般没啥用，因为在sql命令里面一般就指定要选择的列了
- chunksize：如果提供了一个整数值，那么就会返回一个generator，每次输出的行数就是提供的值的大小。
设置参数can–>创建数据库链接的两种方式

用sqlalchemy构建数据库链接

import pandas as pd
import sqlalchemy
from sqlalchemy import create_engine

# 用sqlalchemy构建数据库链接engine
connect_info = 'mysql+pymysql://{}:{}@{}:{}/{}?charset=utf8'
engine = create_engine(connect_info)
# sql 命令
sql_cmd = "SELECT * FROM table"
df = pd.read_sql(sql=sql_cmd, con=engine)

用DBAPI构建数据库链接

import pandas as pd
import pymysql

# sql 命令
sql_cmd = "SELECT * FROM table"

# 用DBAPI构建数据库链接engine
con = pymysql.connect(host=localhost, user=username, password=password, database=dbname, charset='utf8', use_unicode=True)
df = pd.read_sql(sql_cmd, con)