List去重

本文介绍了五种Python中去除列表重复元素的方法,并对比了各种方法的特点及效率。其中包括使用字典.fromkeys()、集合(set)、itertools.groupby、索引排序等方法实现列表去重,同时保持或改变元素原有顺序。

最近任务上有去重,随手翻了下发现有不少好方法啊~

记录一下,转自http://yxmhero1989.blog.163.com/blog/static/112157956201381443244790/:


一.{}.fromkeys(list).keys()

list2 ={}.fromkeys(list1).keys()
二.set

list2 = list(set(list1))
三.itertools.grouby
ids = [1,4,3,3,4,2,3,4,5,6,1]
ids.sort()
it = itertools.groupby(ids)
 for k, g in it:
    print k

四,笨方法

ids = [1,2,3,3,4,2,3,4,5,6,1]
news_ids = []
for id in ids:
    if id not in news_ids:
        news_ids.append(id)

print news_ids

这四种都有个特点,去重后元素排序变了,效率 据说第一种比第二种快一点


五.索引再次排序 这种可以去重并且保持元素顺序

#要结果是[1, 4, 3, 2, 5, 6]  不要[1, 2, 3, 4, 5, 6]
ids = [1,4,3,3,4,2,3,4,5,6,1]
news_ids = list(set(ids))
news_ids.sort(key=ids.index)
print news_ids #[1, 4, 3, 2, 5, 6]

六:Reduce

ids = [1,4,3,3,4,2,3,4,5,6,1]
func = lambda x,y:x if y in x else x + [y]
print reduce(func, [[], ] + ids)#[1, 4, 3, 2, 5, 6]


参考:

http://the5fire.com/python-remove-duplicates-in-list.html

http://xcw31.diandian.com/post/2012-11-28/40042801718

http://www.benben.cc/blog/?p=386
http://blog.youkuaiyun.com/zhengnz/article/details/6265282


### 列表方法概述 在 Python 中,可以通过多种方式实现列表的操作。以下是几种常见的方法及其对应的源码示例。 --- #### 方法一:使用集合 `set` 由于集合中的元素是唯一的,因此可以利用这一特性来快速除列表中的复项[^1]。 ```python def remove_duplicates_with_set(lst): return list(set(lst)) example_list = [1, 2, 2, 3, 4, 4, 5] result = remove_duplicates_with_set(example_list) print(result) # 输出可能为 [1, 2, 3, 4, 5], 集合不保证顺序 ``` 此方法简单高效,但由于集合本身无序,最终返回的结果可能会丢失原始列表中元素的顺序。 --- #### 方法二:保持原顺序并使用辅助集合 如果需要保留原始列表中元素的顺序,则可以在遍历过程中借助一个额外的集合记录已处理过的元素[^1]。 ```python def remove_duplicates_keep_order(lst): seen = set() result = [] for item in lst: if item not in seen: seen.add(item) result.append(item) return result example_list = [1, 2, 2, 3, 4, 4, 5] result = remove_duplicates_keep_order(example_list) print(result) # 输出为 [1, 2, 3, 4, 5] ``` 这种方法既实现了又保留了原有顺序,适用于大多数实际场景。 --- #### 方法三:基于字典键唯一性的解法 (Python 3.7+) 自 Python 3.7 起,内置字典默认按插入顺序保存键值对。因此也可以通过构建临时字典的方式完成,并自动维护输入数据的相对位置关系[^1]。 ```python from collections import OrderedDict def remove_duplicates_with_dict(lst): return list(OrderedDict.fromkeys(lst)) example_list = [1, 2, 2, 3, 4, 4, 5] result = remove_duplicates_with_dict(example_list) print(result) # 输出为 [1, 2, 3, 4, 5] ``` 该方案性能较好,在支持版本范围内推荐优先采用。 --- #### 方法四:列表推导式配合条件判断 对于小型项目或者学习目的而言,还可以尝试用更简洁的一行代码形式表达逻辑: ```python def remove_duplicates_with_comprehension(lst): temp = [] [temp.append(x) for x in lst if x not in temp] return temp example_list = [1, 2, 2, 3, 4, 4, 5] result = remove_duplicates_with_comprehension(example_list) print(result) # 输出为 [1, 2, 3, 4, 5] ``` 尽管语法较为紧凑直观,但其时间复杂度较高(O(n²)),不适合大规模数据集处理需求[^1]。 --- 以上介绍了四种不同的列表技术以及它们各自的优缺点分析。开发者应根据具体应用场景选择最合适的策略实施编码工作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值