Python itertools.groupby

最新推荐文章于 2025-06-15 00:50:26 发布

carol_on_way

最新推荐文章于 2025-06-15 00:50:26 发布

阅读量6.2k

点赞数 8

CC 4.0 BY-SA版权

分类专栏： Python 文章标签： Python

本文链接：https://blog.youkuaiyun.com/carol_in_love/article/details/81435837

Python 专栏收录该内容

3 篇文章

订阅专栏

本文介绍Python标准库itertools中的groupby函数用法，包括如何利用itemgetter和自定义函数进行分组，以及确保分组正确性的排序技巧。

Python itertools.groupby

groupby()把迭代器中相邻的，指定特征重复的元素挑出来放在一起

list中：key相同的dict元素

通常使用itemgetter()参数规定分组依据
也可编写简单的lambda函数传入key参数，作为分组依据（key参数必须传入函数）

from operator import itemgetter #itemgetter用来取dict中的key，省去了使用lambda函数
from itertools import groupby
d1={'name':'zhangsan','age':20,'country':'China'}
d2={'name':'wangwu','age':19,'country':'USA'}
d3={'name':'lisi','age':22,'country':'JP'}
d4={'name':'zhaoliu','age':22,'country':'USA'}
d5={'name':'pengqi','age':22,'country':'USA'}
d6={'name':'lijiu','age':22,'country':'China'}
lst=[d1,d2,d3,d4,d5,d6]

lst.sort(key=itemgetter('country')) #先排序，再进行groupby。lst排序后自身被改变
lstg = groupby(lst,itemgetter('country')) 
#lstg = groupby(lst,key=lambda x:x['country']) 等同于使用itemgetter()

for key,group in lstg:
    print(key,list(group))

#返回：
China [{'name': 'zhangsan', 'age': 20, 'country': 'China'}, {'name': 'lijiu', 'age': 22, 'country': 'China'}]
JP [{'name': 'lisi', 'age': 22, 'country': 'JP'}]
USA [{'name': 'wangwu', 'age': 19, 'country': 'USA'}, {'name': 'zhaoliu', 'age': 22, 'country': 'USA'}, {'name': 'pengqi', 'age': 22, 'country': 'USA'}]

自定义分组

当对groupby()传入key参数，实际上挑选规则通过此函数完成。只要作用于函数的两个相邻元素返回的值相等，这两个元素就被认为在一组，函数返回值作为key。

import itertools

def height_class(h):
    if h>180:
        return 'tall'
    elif h<160:
        return 'short'
    else:
        return 'middle'

friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]

for m,n in itertools.groupby(friends,key = height_class):
    print(m,list(n))

#返回：
tall [191]
short [158, 159]
middle [165, 170, 177]
tall [181, 182, 190]

由于191与181,182,190不相邻，因此分组结果不在一组。

欲使所有相同key的元素在一组中，要在list传入groupby()之前进行排序

import itertools

def height_class(h):
    if h>180:
        return 'tall'
    elif h<160:
        return 'short'
    else:
        return 'middle'

friends = [191, 158, 159, 165, 170, 177, 181, 182, 190]

friends = sorted(friends,key = height_class)

for m,n in itertools.groupby(friends,key = height_class):
    print(m,list(n))

#返回：
middle [165, 170, 177]
short [158, 159]
tall [191, 181, 182, 190]