django orm中利用annotate进行group by

最新推荐文章于 2023-03-17 14:27:18 发布

转载最新推荐文章于 2023-03-17 14:27:18 发布 · 1.5k 阅读

3 ·

CC 4.0 BY-SA版权

原文链接：https://my.oschina.net/watcher/blog/775258

文章标签：

#python #数据库

本文详细介绍了在Django 1.8及以后版本中如何使用annotate进行分组查询，包括不同场景下的具体实现方式，并通过实例展示了如何正确地进行字段选择与聚合。

2019独角兽企业重金招聘Python工程师标准>>>

用法

之前的orm的group by方法在django 1.8 中已经不能使用，需要利用annotate来实现

示例1

第一个values用来选中需要用来group by的字段（此处group by user_id），之后紧跟annotate来分组并聚合需要的字段（需要每个user_id对应的question_id的数量和catalog_id的最小值），之后再values来实际查询需要的字段（原user_id和聚合后的字段的别名）

第一个values用来指定用来group by的字段，里面必须是Count、Min等等聚合函数（例如用F("user_id")取别名是不行的），不需要最终查询的就不必聚合了
第二个values用来指定实际select的字段，只能指定annotate后的字段名（以此处为例：user_id是用来分组的字段，可以直接取，而其他字段必须聚合并使用聚合后的别名，qid和cid，假如原表还有个字段status，annotate中没有聚合此字段，所以最后value不能查询该字段）

q = PxbNCEUserQuest.objects.filter(user_id=335).values("user_id").annotate(qid=Min("question_id"), cid=Min("catalog_id")).values("user_id", "qid", "cid")
print q
print q.query

# 输出
[{'qid': 22, 'user_id': 335L, 'cid': 17}]

SELECT `pxb_nce_user_quest`.`user_id`, MIN(`pxb_nce_user_quest`.`question_id`) AS `qid`, MIN(`pxb_nce_user_quest`.`catalog_id`) AS `cid` FROM `pxb_nce_user_quest` WHERE `pxb_nce_user_quest`.`user_id` = 335 GROUP BY `pxb_nce_user_quest`.`user_id` ORDER BY NULL

示例2

与示例1一样，但是此处第一个annotate用来分组字段，第二个annotate用来单独别名其他字段

q = PxbNCEUserQuest.objects.filter(user_id=335).values("user_id").annotate(qid=Min("question_id"), cid=Min("catalog_id")).annotate(uid=F("user_id")).values("uid", "qid", "cid")
print q
print q.query
# 输出：
[{'qid': 22, 'uid': 335L, 'cid': 17}]

SELECT MIN(`pxb_nce_user_quest`.`question_id`) AS `qid`, MIN(`pxb_nce_user_quest`.`catalog_id`) AS `cid`, `pxb_nce_user_quest`.`user_id` AS `uid` FROM `pxb_nce_user_quest` WHERE `pxb_nce_user_quest`.`user_id` = 335 GROUP BY `pxb_nce_user_quest`.`user_id` ORDER BY NULL