Python DataFarme 存取数据库方式及其性能

最新推荐文章于 2023-05-06 20:17:08 发布

原创

最新推荐文章于 2023-05-06 20:17:08 发布 · 556 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#Python #Pandas #读数据 #取数据 #性能比较

本文探讨了Python Pandas DataFrame在读取和写入MySQL数据时的不同方法，包括原始方式与Pandas内置函数。研究发现，对于小规模数据，原生方法读取更快，而大规模数据时Pandas的`read_sql`更优。在写入方面，构建字典的方式比构建元组在大量数据时更高效，且速度比Pandas的`to_sql`快约50%，但`to_sql`胜在代码简洁和对缺失值的支持。

前言

在实际开发过程中发现Python Pandas.DataFrame 包含直接读取MySQL表及存储MySQL表的函数，于是测试了不同方式读数据、写MySQL表数据的代码简易性及性能的研究。

1. 读数据

1.1 原有读数据方式：

def query_to_df(query, conn):
    try:
        cur = conn.cursor()
        cur.execute(query)
        r = cur.fetchall()
        cols = [n[0] for n in cur.description]
        arr = list(r)
        data = pd.DataFrame.from_records(arr, columns=cols)
    except:
        raise
    finally:
        close_conn_resource(conn, cur)
    return data

1.2 Pandas自带读数据方式：

def read_df_by_pd(query, conn):   
    try:
        data = pd.read_sql(query, conn

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

白熊花田

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python入门之数据库操作

weixin_42551921的博客

04-26

7865

1、目前主流的数据库有两种，一个是关系型数据库，如MySql 一个是非关系型数据库 如mongodb 对与mysql和mongodb数据库，python中分别有对接的连接操作库 2、python连接mysql: 在python中，连接mysql用到的库是 pymysql 安装方法直接使用命令： pip install pymsql 引入方式： import pymysql 连接数据库： db = pymysql.connect(host='127.0.0.1',

Python连接数据库将结果转换为DataFrame(列名和表字段一致)

#include

02-27

4155

很多时候，我们用Python处理数据，需要连接到Mysql、Postgresql等数据库，获取表数据，再构建pandas的DataFrame进行进一步处理。但是查询数据库结果集是没有表字段名称的，我们希望构建的DataFrame的列名和表字段一样。直接上代码这里以Postgresql数据库为例，Mysql数据库差不多，其他的自行改造。先封装一个查询类，查询返回的结果是一个字典，head是表列...

参与评论您还未登录，请先登录后发表或查看评论

Python如何将Dataframe直接写入数据库

qq_43492878的博客

05-06

3216

在使用pandas的过程中，我们有时候会需要将某个Dataframe存入数据库中，我们可以直接使用sqlalchemy 库和pandas。表示将users这个dataframe写入engine指定的数据库中，表名为users，如果存在该表则删除后重新创建。

pandas实现to_sql将DataFrame保存到数据库中

12-26

目的在数据分析时，我们有中间结果，或者最终的结果，需要保存到数据库中；或者我们有一个中间的结果，如果放到数据库中通过sql操作会更加的直观，处理后再将结果读取到DataFrame中。这两个场景，就需要用到DataFrame的to_sql操作。具体的操作连接数据库代码 import pandas as pd from sqlalchemy import create_engine # default engine = create_engine('mysql+pymysql://ledao:ledao123@localhost/pandas_learn') original_data

dataframe格式知识点总结

weixin_44109266的博客

11-04

6637

dataframe格式常见操作总结

python模块之bsddb: bdb高性能嵌入式数据库

Miss_Audrey的博客

09-19

1189

基础知识 bsddb模块是用来操作bdb的模块，bdb是著名的Berkeley DB，它的性能非常好，mysql的存储后端引擎都支持bdb的方式。这里简单介绍一些关于bsddb的使用方法。 bdb不同于一般的关系数据库，它存储的数据只能是以key和value组成的一对数据，使用就像python的字典一样，它不能直接表示多个字段，当要存储多个字段的数据时，只能把数据作为一个整体存放到value中。 ...

python 哪个数据库 性能好_python测试mysql数据库性能（二）

weixin_39724441的博客

12-05

151

config ={'host': 'localhost','port': 3306,'database': 'test','user': 'root','password': '1234qwer','charset': 'utf8'}conn= pymysql.connect(**config)cur=conn.cursor()deftimer(fn):def_wrapper(count):sta...

python连接mysql数据库示例代码

05-14

Python 连接 MySQL 数据库示例代码内容概要本资源提供了通过 Python 连接 MySQL 数据库的完整示例代码，旨在帮助读者理解如何在 ...此资源以手写代码的方式讲解 Python 连接 MySQL 数据库的基本操作和核心功能，

从零开始学习 Python 3 - 数据库交互 1：Python 操作 SQLite 数据库，数据持久化存储！

05-26

数据存储不用愁，Python 操作 SQLite 数据库，让数据持久化存储！

【数据库编程】Python操作MySQL数据库：基于DB-API规范的数据库连接与操作详解介绍了Python通过DB

最新发布

06-02

重点讲解了MySQLdb模块的安装步骤及其在Python中连接MySQL的具体流程，包括连接数据库、创建表、插入、查询、更新和删除数据等基本操作。同时，文档还深入探讨了事务处理的四大特性（原子性、一致性、隔离性和持久性...

ubuntu系统下 python链接mysql数据库的方法

12-25

创建数据库 mysql -u root -p passward 链接数据库 create database basename use basename 如果数据库存在要进行改动可以直接使用 mysql -u root -p passward basename 创建表 create table latest_face( id ...

Python中3大数据库特性

sun_daming的博客

04-17

483

概念：MySQL：是一种关系型数据库管理系统（支持大型数据库），存储于硬盘，支持数据持久化MongoDB：基于分布式文件存储的数据库管理系统（具备MySQL的大部分功能，主要还支持对数据建立索引）Redis：是键值数据库，缓存数据库，而且是非关系型数据库特点： MySQL：可以处理拥有上千万条记录的大型数据；支持常见的SQL语句规范；可移植行高，安装简单小巧；良好的运行效率，有丰富信息的网络...

python query方法_Pandas dataframe.query方法语法

weixin_42138703的博客

01-14

4859

问题：我想更好地理解PandasDataFrame.query方法以及下面的表达式表示什么：match = dfDays.query('index > @x.name & price >= @x.target')@x.name代表什么？我理解这段代码(一个包含pandas.tslib.Timestamp数据的新列)的结果输出是什么，但不清楚用于获取此最终结果的表达式。数据：从这...

python数据分析中dataframe中使用query()函数实现对dataframe进行行挑选

naihenumberone的博客

03-26

1048

https://cloud.tencent.com/developer/article/1409107

提高数据科学效率的 8 个Python神库

sixqingfeng的博客

07-29

231

在进行数据科学时，可能会浪费大量时间编码并等待计算机运行某些东西。所以我选择了一些Python库，可以帮助你节省宝贵的时间。

24个顶级Python库

多看多听多总结

05-01

2173

用于不同数据科学任务的Python库用于数据收集的Python库 · Beautiful Soup · Scrapy · Selenium 用于数据清理和数据操作的Python库 · Pandas · PyOD · NumPy · Spacy 用于数据可视化的Python库 · Matplotlib · Seaborn · Bokeh 用于建模的Python库 · Scikit-learn · TensorFlow · PyTorch 用于模型解释的Python库

python字典转datafarm，pandas

weixin_30702413的博客

03-01

655

# coding:utf-8 import json import pandas as pd with open("./article_file/all_article.json","r",encoding="gbk") as f: text = json.load(f) article_dict = {"title":[],"content":[]} for it...

利用Python将数据库提取的数据转为DataFrame格式