Python+SQL:在python中调用sql文件并运行转化为Datafarme

因为需要从数据库中取数并且在python中进行排版、分析等操作,每次都需要从dbeaver运行sql导出excel,然后再导入python进行后续操作,而直接在python中调用sql文件就免去了这个中间环节,更加简便。

1. 读取sql文件(hive)

with open(r'\sql_test.sql') as f:
    sql = f.read()

读取出的sql类型为字符串,有非常多的'\n\t',没关系,可以正常运行。

2. 构建下载函数

import pandas as pd
from impala.dbapi import connect
from hdfs.client import Client
from hdfs import InsecureClient
def getDatabaseConnection():
    """
    获取数据库连接和游标
    """
    return connect(host='XXX', port=XXX, auth_mechanism='XXX', user='XXX', password='XXX', database='XXX')
def executeSqlString(sql_string):
    """
    执行SQL语句
    """
    with getDatabaseConnection().cursor() as cur:
        cur.execute(sql_string)
    return 'SQL已执行'
def transferSqlOutput2Dataframe(sql, column_names):
    """
    执行SQL语句并将结果转为DataFrame
    """
    with getDatabaseConnection().cursor() as cur:
        cur.execute(sql)
        sql_data = cur.fetchall()
    return pd.DataFrame(sql_data, columns=column_names)

3. 运行sql并转化为Dataframe

使用transferSqlOutput2Dataframe,输入sql和columns(列名)参数并运行:

*前提需要知道导出的数据的列名,这样才能在转化为Dataframe的时候赋上对应的列名。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值