SQL与NoSQL的选择
SQL数据库是基于关系模型的关系型数据库,使用结构化查询语言(Structured Query Languag),很高效,少重复
NoSQL包括文档数据库、键值对数据库、列存储数据库、图形数据库,放宽对一致性的要求,有性能上的优势
两者各有好坏,可以根据实际去选择,这里我用的SQLite(不需要服务器便于演示)
SQLAlchemy的使用
SQLAlchemy提供了SQL工具包及对象关系映射(ORM)工具,也就是数据库抽象层,Flask-SQLAlchemy包装了SQLAlchemy,安装起来方便快捷:
pip install flask-sqlalchemy
安装后需要在app.config
字典中添加数据库的URI和配置项,改动代码如下:
from flask_sqlalchemy import SQLAlchemy
...
basedir = os.path.abspath(os.path.dirname(__file__)) # 根据文件名确定绝对路径
app.config['SQLALCHEMY_DATABASE_URI'] = 'sqlite:///' + os.path.join(basedir, 'data.sqlite') # 组成数据库文件路径
app.config['SQLALCHEMY_COMMIT_ON_TEARDOWN'] = True
...
db = SQLAlchemy(app) # db实例表示程序使用的数据库,提供了常用方法供使用
在Flask-SQLAlchemy中,数据库使用URL指定,最流行的数据库引擎采用的数据库URL格式如下:
数据库引擎 | URL |
---|---|
MySQL | mysql://username:password@hostname/database |
Postgres | postgresql://username:password@hostname/database |
SQLite(Unix) | sqlite:absolute/path/to/database |
SQLite(Windows) | sqlite:///c:/absolute/path/to/database |
定义模型
模型表示程序中使用的持久化实体,在ORM中,模型是一个类,类中的属性对应数据库表中的列
持久化:是将程序数据在持久状态和瞬时状态间转换的机制。通俗的讲,就是瞬时数据(比如内存中的数据,是不能永久保存的)持久化为持久数据(比如持久化至数据库中,能够长久保存)
Flask-SQLAlchemy创建的数据库实例为模型提供了一个基类(db.Model
)以及一系列辅助类和辅助函数,可用于定义模型的结构,让我们定义Role和User模型:
class Role(db.Model):
__tablename__= "roles"
id = db.Column(db.Integer, primary_key=True)
name = db.Column(db.String(64), unique=True)
users = db.relationship("User", backref="role") # 这个关系的面向对象视角, backref向User模型添加了role属性来定义反向关系
def __repr__(self):
return "<Role %r>" % self.name
class User(db.Model):
__tablename__="users"
id = db.Column(db.Integer, primary_key=True)
username = db.Column(db.String(64), unique=True, index=True)
role_id = db.Column(db.Integer, db.ForeignKey("roles.id"))
def __repr__(self):
return "<User %r>" % self.username
类变量__tablename__
定义在数据库中使用的表名,如果没有则使用一个默认名字,但默认的表名没有遵守使用复数形式进行命名的约定,所以自己来指定,其余的类变量都是该模型的属性,被定义为db.Column
类的实例
db.Column
类构造函数的第一个参数是数据库字段的类型
下表是可用的列类型以及在模型中使用的Python类型:
类型名 | Python类型 | 说 明 |
---|---|---|
Integer | int | 普通整数,一般是32位 |
SmallInteger | int | 取值范围小的整数,一般是16位 |
BigInteger | int或long | 不限制精度的整数 |
Float | float | 浮点数 |
Numeric | decimal.Decimal | 定点数 |
String | str | 变长字符串 |
Text | str | 变长字符串,对较长或不限长度的字符串做了优化 |
Unicode | unicode | 变长Unicode字符串 |
UnicodeText | Unicode | 变长Unicode字符串,对较长或不限长度的字符串做了优化 |
Boolean | bool | 布尔值 |
Date | datetime.date | 日期 |
Time | datetime.time | 时间 |
DateTime | datetime.datetime | 日期和时间 |
Interval | datetime.timedelta | 时间间隔 |
Enum | str | 一组字符串 |
PickleType | 任何Python对象 | 自动使用pickle序列化 |
LargeBinary | str | 二进制文件 |
db.Column
中其余的参数指定属性的配置选项,下表是最常使用的SQLAlchemy列选项:
选项名 | 说明 |
---|---|
primary_key | 如果设为True,这列就是表的主键 |
unique | 如果设为True,这列不允许出现重复的值 |
index | 如果设为True,为这列创建索引,提升查询效率 |
nullable | 如果设为True,这列允许使用空值,如果设为False,这列不允许使用空值 |
default | 为这列设定默认值 |
__repr__
方法:返回一个具有可读性的字符串表示模型,可在调试和测试时使用
建立关系
先来定义用户和角色的一对多关系,即一个角色可属于多个用户,而每个用户都只能有一个角色
看刚才定义的两个模型(表),其中roles
表存储所有可用的用户角色,每个角色都使用一个唯一的id值(即表的主键)进行标识,users
表包含用户列表,每个用户也有唯一的id值,除了id主键之外,roles
表中还有name
列和password
列,users
表中的role_id
是外键,引用角色的id,通过外键建立起了关系,传给db.Foreignkey()
的参数'roles.id'
表明这列的值是roles
表中的id
值
添加到Role模型中的users
属性代表这个关系的面向对象视角,可以通过该属性返回与角色相关联的用户组成的列表,db.relationship()
的第一个参数是与其建立关系的那个模型(表),如果模型类尚未定义,可使用字符串形式指定,第二个backref
参数向User
模型中添加一个role
属性,定义反向关系,通过它可以访问Role
模型,这时获取的是模型对象,而不是外键的值
正常db.relationship()
都能自己找到关系中的外键,如果模型中有两个或以上外键,SQLAlchemy就不知道该使用哪列,这时就要为db.relationship()
提供额外参数,从而确定所用外键
下表是定义关系时常用的关系选项:
选项名 | 说明 |
---|---|
backref | 在关系的另一个模型中添加反向引用 |
primaryjoin | 明确指定两个模型之间使用的联结条件,只在模棱两可的关系中需要指定 |
lazy | 指定如何加载相关记录,可选值有select(首次访问时按需加载)、immediate(源对象加载后就加载)、joined(加载记录,但使用联结)、subquery(立即加载,但使用子查询)、noload(永不加载)和dynamic(不加载记录,但提供加载记录的查询) |
uselist | 如果设为False,不使用列表,而使用标量值 |
order_by | 指定关系中记录的排序方式 |
secondary | 指定多对多关系中关系表的名字 |
secondaryjoin | SQLAlchemy无法自行决定时,指定多对多关系中的二级联结条件 |
常见的除了一对多关系还有:
一对一关系:可以用一对多关系表示,但需要在db.relationship()
里把uselist
设为False
,把”多”变成”一”,
多对一关系:也可使用一对多表示,对调两个表即可;或者把外键和db.relationship()
都放在”多”这一侧,
多对多:需要用到第三张表,这个表称为关系表,之后会写到