Python 中的数据持久化方案-优快云博客

本文链接：https://blog.youkuaiyun.com/2501_91304071/article/details/146877512

```html Python 中的数据持久化方案

Python 中的数据持久化方案

在软件开发中，数据持久化是一个非常重要的概念，它指的是将程序运行时生成的数据保存到存储设备上，以便在程序关闭或重启后能够重新加载这些数据。Python 作为一种功能强大且灵活的编程语言，提供了多种方式来实现数据持久化。本文将介绍几种常见的 Python 数据持久化方案，并分析它们的特点和适用场景。

1. 文件操作

文件操作是最基础的数据持久化方法之一。Python 提供了内置的 `open()` 函数，可以方便地读写文本文件或二进制文件。例如，使用 `pickle` 模块可以序列化 Python 对象并将其保存到文件中，之后可以通过反序列化恢复对象。


import pickle

# 序列化数据
data = {'name': 'Alice', 'age': 25}
with open('data.pkl', 'wb') as f:
    pickle.dump(data, f)

# 反序列化数据
with open('data.pkl', 'rb') as f:
    loaded_data = pickle.load(f)
print(loaded_data)  # 输出: {'name': 'Alice', 'age': 25}

文件操作简单易用，适合处理小规模数据。然而，当数据量较大时，文件操作可能会变得效率低下，且不支持并发访问。

2. SQLite 数据库

SQLite 是一个轻量级的关系型数据库引擎，它不需要单独的服务进程即可运行。Python 的标准库 `sqlite3` 模块使得与 SQLite 数据库交互变得非常方便。SQLite 适用于需要结构化存储的小型项目。


import sqlite3

# 连接到数据库（如果不存在则创建）
conn = sqlite3.connect('example.db')
cursor = conn.cursor()

# 创建表
cursor.execute('''CREATE TABLE IF NOT EXISTS users (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    name TEXT NOT NULL,
                    age INTEGER);''')

# 插入数据
cursor.execute("INSERT INTO users (name, age) VALUES (?, ?)", ('Bob', 30))

# 查询数据
cursor.execute("SELECT * FROM users")
rows = cursor.fetchall()
for row in rows:
    print(row)

# 关闭连接
conn.close()

SQLite 数据库易于部署和使用，但在高并发环境下可能表现不佳。

3. JSON 和 YAML

JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，而 YAML（YAML Ain't Markup Language）则更接近于人类可读的配置文件格式。Python 标准库中的 `json` 模块可以直接处理 JSON 数据，而 `PyYAML` 第三方库则用于解析和生成 YAML 文件。


import json

# 将数据转换为 JSON 字符串
data = {'name': 'Charlie', 'age': 28}
json_str = json.dumps(data)
print(json_str)  # 输出: {"name": "Charlie", "age": 28}

# 将 JSON 字符串转换回 Python 对象
parsed_data = json.loads(json_str)
print(parsed_data)  # 输出: {'name': 'Charlie', 'age': 28}

JSON 和 YAML 都非常适合用于配置文件或小型数据存储，但它们缺乏对复杂数据类型的原生支持。

4. ORM 框架

对象关系映射（ORM）框架如 SQLAlchemy 提供了一种高级的方式来管理数据库交互。ORM 允许开发者通过面向对象的方式定义模型类，然后由框架自动完成 SQL 查询的生成和执行。


from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

Base = declarative_base()

class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    age = Column(Integer)

engine = create_engine('sqlite:///example.db')
Base.metadata.create_all(engine)
Session = sessionmaker(bind=engine)
session = Session()

new_user = User(name='David', age=35)
session.add(new_user)
session.commit()

users = session.query(User).all()
for user in users:
    print(user.name, user.age)

session.close()

ORM 框架极大地简化了数据库操作，尤其适合大型应用程序。不过，它们的学习曲线较陡峭，并且性能可能不如直接编写 SQL。