Django 中Queryset 以及的 QuerySet 缓存机制

原创已于 2024-11-27 19:06:39 修改 · 1.3k 阅读

22 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #django #python

于 2024-11-27 19:06:26 首次发布

Django从入门到精通专栏收录该内容

18 篇文章

订阅专栏

Django中的QuerySet缓存机制是一种优化数据库查询性能的重要特性。它允许Django在执行相同的查询时，避免重复访问数据库，而是从缓存中直接获取结果。以下是对Django QuerySet缓存机制的详细解释，包括QuerySet的生命周期和缓存行为：

QuerySet的生命周期

创建QuerySet：
- 当调用如Book.objects.all()、Book.objects.filter(title='Django')等查询方法时，Django会返回一个QuerySet对象。这个对象是一个特殊的Python对象，它表示一个从数据库中获取的对象集合。
- 初始创建的QuerySet并不会立即执行数据库查询，而是等待进一步的操作。
执行查询：
- 当对QuerySet进行迭代、切片、求长度、布尔值判断、序列化、repr()调用或将其转换为列表等操作时，Django会执行数据库查询来获取数据。
- 首次执行查询时，Django会访问数据库，并将查询结果缓存到QuerySet的_result_cache属性中。
缓存结果：
- 一旦QuerySet的结果被缓存，后续的相同查询操作将直接从缓存中获取数据，而不是再次访问数据库。
- 需要注意的是，只有对同一个QuerySet对象进行相同的查询操作才会利用缓存。如果创建了两个不同的QuerySet对象，即使它们执行相同的查询，也不会共享缓存。
QuerySet的不可变性：
- QuerySet对象是不可变的。每次对QuerySet进行过滤、排序等操作时，都会返回一个新的QuerySet对象。
- 因此，对原始QuerySet的修改（如添加过滤器）不会影响已缓存的结果。

QuerySet的缓存行为

缓存何时被填充：
- 当对QuerySet进行迭代、切片（但需要注意，切片本身不会填充缓存，除非是对整个QuerySet进行迭代）、求长度、布尔值判断、序列化、repr()调用或将其转换为列表等操作时，缓存会被填充。
- 简单地打印QuerySet对象不会填充缓存。
缓存的持久性：
- QuerySet的缓存是内存级别的，它只在当前Python进程的生命周期内有效。
- 一旦进程结束，缓存也会被销毁。因此，QuerySet的缓存不适用于跨进程或跨会话的场景。
缓存的局限性：
- 使用切片或索引来限制QuerySet时，如果所请求的部分不在缓存中，那么接下来查询返回的记录将不会被缓存。
- 这意味着，如果多次请求QuerySet中的相同索引或切片范围，并且这些请求之间没有对整个QuerySet进行迭代以填充缓存，那么每次请求都会触发数据库查询。
优化查询性能：
- 为了充分利用QuerySet的缓存机制，建议对相同的查询结果重用同一个QuerySet对象。
- 避免在循环或多次调用中重复创建相同的QuerySet对象。
特殊情况：
- 当使用exists()方法时，Django会执行一个特殊的查询来检查QuerySet中是否有数据，但不会将结果缓存到_result_cache中。
- 当处理非常大的QuerySet时，可以使用iterator()方法来避免一次性将所有数据加载到内存中。但请注意，使用iterator()方法会禁用QuerySet的缓存机制。

在Django中，QuerySet是Django ORM（对象关系映射）中用于表示数据库查询结果集合的对象。以下是一些会得到QuerySet的操作和不会得到QuerySet的操作：

会得到QuerySet的操作

基本查询方法：
- all()：返回模型的所有对象。
- filter(**kwargs)：返回满足给定条件的对象集合。
- exclude(**kwargs)：返回不满足给定条件的对象集合。
- order_by(*fields)：根据一个或多个字段对查询结果进行排序。
查询集修改：
- 大多数查询集修改方法（如filter、exclude、order_by等）都会返回一个新的QuerySet，而不是修改原始QuerySet。
聚合和注解：
- annotate(**kwargs)：使用提供的查询表达式对QuerySet中的每个对象进行注解。返回一个新的QuerySet，其中包含注解的结果。
- aggregate(**kwargs)：对QuerySet计算聚合值（如总和、平均值等）。虽然aggregate方法本身不返回QuerySet，但它通常与QuerySet一起使用，并且是在QuerySet的基础上进行的聚合操作。然而，为了回答这个问题，我们可以认为使用aggregate之前的QuerySet操作会得到QuerySet。
切片：
- 对QuerySet进行切片操作（如queryset[0:10]）会返回一个新的QuerySet，包含原始QuerySet中指定范围的元素。
特殊查询方法：
- values(*fields)：返回一个包含指定字段的字典列表。虽然返回的不是标准的QuerySet对象，但返回的结果仍然具有QuerySet的某些特性，如可迭代性。然而，为了简化回答，我们可以认为这种方法得到的是一种特殊的、类似于QuerySet的对象，但在严格意义上它可能不被视为标准的QuerySet。
- values_list(*fields, flat=False, named=False)：返回一个包含指定字段值的元组列表。与values方法类似，返回的结果也具有QuerySet的某些特性。
其他方法：
- reverse()：反转QuerySet中的元素顺序。
- distinct()：返回一个新的QuerySet，消除查询结果中的重复记录。
- iterator(chunk_size=None)：用于迭代查询结果，可以指定每次从数据库中获取的记录数。虽然它返回的是一个迭代器，但该迭代器是基于QuerySet的，并且可以用于遍历QuerySet中的对象。

不会得到QuerySet的操作

聚合方法：
- 如前所述，aggregate(**kwargs)方法本身不返回QuerySet，而是返回一个包含聚合值的字典。
获取单个对象的方法：
- get(**kwargs)：返回满足条件的单个对象。如果找不到对象或找到多个对象，将抛出异常。由于它返回的是单个Model实例而不是QuerySet，因此不属于得到QuerySet的操作。
- first()：返回QuerySet中的第一个对象（如果存在）。如果没有对象，则返回None。同样，它返回的是单个Model实例。
- last()：返回QuerySet中的最后一个对象（如果存在）。如果没有对象，则返回None。它也是返回单个Model实例的方法。
执行数据库操作的方法：
- update(**kwargs)：直接对QuerySet中的对象执行更新操作。它返回更新的对象数，而不是QuerySet。
- delete()：删除QuerySet中的所有对象。它返回删除的对象数（以及可能删除的关联对象的数量，取决于数据库和Django的版本），而不是QuerySet。
- count()：返回QuerySet中的对象数量。它返回一个整数，而不是QuerySet。
- exists()：如果QuerySet包含任何对象，则返回True；否则返回False。它返回一个布尔值，而不是QuerySet。
其他非查询方法：
- create(**kwargs)：创建一个新的对象并保存到数据库中。它返回新创建的Model实例，而不是QuerySet。
- bulk_create(objs, batch_size=None)：批量创建对象并保存到数据库中。它返回一个包含新创建对象的列表（但不一定是QuerySet）。
- get_or_create(**kwargs)：尝试获取满足条件的对象；如果不存在，则创建一个新对象。它返回一个元组，包含（对象，是否创建）。
- update_or_create(**kwargs)：类似于get_or_create，但用于更新或创建对象。它返回一个元组，包含（对象，是否创建）。