combinations
combinations(iterable, r) 创建一个迭代器,返回iterable中所有长度为r的子序列,返回的子序列中的项按输入iterable中的顺序排序
from itertools import combinations
list(combinations(range(3),repeat=1))

product
product(*iterables[, repeat]) 创建一个迭代器,生成表示iterables中的项目的笛卡尔积的元组,repeat表示重复生成序列的次数
from itertools import product
list(product(range(3),repeat=1))

groupby
以为只有pandas有groupby,没想到python自带groupby,两个的不同点在于自带版本只能聚合相邻相同key,pandas的聚合没有相邻这个限制
所以切记:乱序的文件输入之前,要先排序
# -*-coding:utf-8-*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import os
import re
from itertools import groupby
def group_pattern(line):
return line.strip().split("\t")[0]
def main():
groups = groupby(sys.stdin, group_pattern)
for key, values in groups:
value = list(values)
for sub in value:
fs = str(sub.strip()).split("\t")
...剩下操作就看自己了...
本文详细介绍了Python内置模块`itertools`中的`combinations`、`product`和`groupby`函数。`combinations`用于生成给定可迭代对象的所有不重复组合;`product`则生成笛卡尔积,可以指定重复次数;`groupby`则用于对连续的重复元素进行分组,但要求输入数据必须预先排序。示例代码展示了如何使用这些函数处理序列数据。
18

被折叠的 条评论
为什么被折叠?



