django orm中利用annotate进行group by

本文详细介绍了在Django 1.8及以后版本中如何使用annotate进行分组查询,包括不同场景下的具体实现方式,并通过实例展示了如何正确地进行字段选择与聚合。

用法

之前的orm的group by方法在django 1.8 中已经不能使用,需要利用annotate来实现

  • 示例1

第一个values用来选中需要用来group by的字段(此处group by user_id),之后紧跟annotate来分组并聚合需要的字段(需要每个user_id对应的question_id的数量和catalog_id的最小值),之后再values来实际查询需要的字段(原user_id和聚合后的字段的别名)

  1. 第一个values用来指定用来group by的字段,里面必须是Count、Min等等聚合函数(例如用F("user_id")取别名是不行的),不需要最终查询的就不必聚合了

  2. 第二个values用来指定实际select的字段,只能指定annotate后的字段名(以此处为例:user_id是用来分组的字段,可以直接取,而其他字段必须聚合并使用聚合后的别名,qid和cid,假如原表还有个字段status,annotate中没有聚合此字段,所以最后value不能查询该字段)

q = PxbNCEUserQuest.objects.filter(user_id=335).values("user_id").annotate(qid=Min("question_id"), cid=Min("catalog_id")).values("user_id", "qid", "cid")
print q
print q.query

# 输出
[{'qid': 22, 'user_id': 335L, 'cid': 17}]

SELECT `pxb_nce_user_quest`.`user_id`, MIN(`pxb_nce_user_quest`.`question_id`) AS `qid`, MIN(`pxb_nce_user_quest`.`catalog_id`) AS `cid` FROM `pxb_nce_user_quest` WHERE `pxb_nce_user_quest`.`user_id` = 335 GROUP BY `pxb_nce_user_quest`.`user_id` ORDER BY NULL
  • 示例2
  1. 与示例1一样,但是此处第一个annotate用来分组字段,第二个annotate用来单独别名其他字段
q = PxbNCEUserQuest.objects.filter(user_id=335).values("user_id").annotate(qid=Min("question_id"), cid=Min("catalog_id")).annotate(uid=F("user_id")).values("uid", "qid", "cid")
print q
print q.query
# 输出:
[{'qid': 22, 'uid': 335L, 'cid': 17}]

SELECT MIN(`pxb_nce_user_quest`.`question_id`) AS `qid`, MIN(`pxb_nce_user_quest`.`catalog_id`) AS `cid`, `pxb_nce_user_quest`.`user_id` AS `uid` FROM `pxb_nce_user_quest` WHERE `pxb_nce_user_quest`.`user_id` = 335 GROUP BY `pxb_nce_user_quest`.`user_id` ORDER BY NULL

举例:

  • SomeModel.objects.annotate(Count('somecol'))

GROUP BY: 所有字段

  • SomeModel.objects.values('name').annotate(Count('somecol'))

GROUP BY: name字段,聚合somecol

  • SomeModel.objects.annotate(Count('somecol')).values('name')

GROUP BY: 所有字段,查询name

  • SomeModel.objects.values('name', 'pk').annotate(Count('somecol')).values('pk')

GROUP BY: name, pk字段,查询pk字段

  • SomeModel.objects.values('name').annotate(Count('somecol')).values('pk')

GROUP BY: name, pk字段,查询pk字段

关联知识:

刚开始上面的查询方法可能比较难理,但是对比原生sql语句的group by方法就会发现类似原理

  • 老版本mysql中

select a, b from t group by a会正常工作,b字段会自动取第一条,等于是隐式聚合了

  • 新版本mysql中以上语句不能工作,因为默认启用严格模式sql_mode=ONLY_FULL_GROUP_BY,正确方法是:

select a,max(b) as b from t group by,即需要显示的聚合所有查询的字段

对比新版mysql语法会发现跟orm中查询方法很类似

转载于:https://my.oschina.net/watcher/blog/775258

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值