python集合是什么意思_Python集合是什么，为什么应该使用以及如何使用？-优快云博客

本文介绍了Python集合的基本概念，包括什么是集合、为何使用集合以及如何创建和操作集合。通过实例展示了集合的无序特性、成员测试效率提升、去重和数学运算功能。此外，还提供了使用集合删除重复元素和比较列表与集合性能的方法。

Python集合是什么，为什么应该使用以及如何使用？-1.jpg (34.56 KB, 下载次数: 0)

2018-7-30 18:07 上传

Python集合是什么，为什么应该使用以及如何使用？-2.jpg (23.96 KB, 下载次数: 0)

2018-7-30 18:07 上传

Python Sets: What, Why and How

Python 配备了几种内置数据类型来帮我们组织数据。这些结构包含列表、字典、元组和集合。

根据 Python 3 文档：

集合是一个无序集合，没有重复元素。基本用途包含成员测试和消除重复的条目。集合对象还支持数学运算，如并集、交集、差集和对等差分。

在本文中，我们将回顾并查看上述界说中列出的每个要素的示例。让我们马上开始，看看如何建立它。

初始化一个集合

有两种体例可以建立一个集合：一个是给内置函数 set() 提供一个元素列表，另一个是使用花括号 {}。

使用内置函数 set() 来初始化一个集合：

>>> s1 = set([1, 2, 3])>>> s1{1, 2, 3}>>> type(s1)

使用 {}：

>>> s2 = {3, 4, 5}>>> s2{3, 4, 5}>>> type(s2)>>>

如你所见，这两种体例都是有效的。但问题是，如果我们想要一个空的集合呢？

>>> s = {}>>> type(s)

没错，如果我们使用空花括号，我们将获得一个字典而不是一个集合。=)

值得一提的是，为了简单起见，本文中提供的所有示例都将使用整数集合，但集合可以包含 Python 支持的所有可哈希的

hashable

数据类型。换句话说，即整数、字符串和元组，而不是列表或字典这样的可变类型。

>>> s = {1, 'coffee', [4, 'python']}Traceback (most recent call last): File "", line 1, in TypeError: unhashable type: 'list'

既然你知道了如何建立一个集合以及它可以包含哪些类型的元素，那么让我们继续看看为什么我们总是应该把它放在我们的工具箱中。

为什么你需要使用它

写代码时，你可以用不止一种体例来完成它。有些被认为是相当糟糕的，另一些则是清晰的、简洁的和可维护的，或者是 “Python 式的

pythonic

”。

根据 Hitchhiker 对 Python 的建议:

当一个经验丰富的 Python 开发人员(Python 人

Pythonista

)挪用一些不敷 “Python 式的

pythonic

” 的代码时，他们通常认为着这些代码不遵循通用指南，并且无法被认为是以一种好的体例(可读性)来表达意图。

让我们开始探索 Python 集合那些不但可以帮忙我们提高可读性，还可以加快程序执行时间的体例。

无序的集合元素

首先你需要明白的是：你无法使用索引拜候集合中的元素。

>>> s = {1, 2, 3}>>> s[0]Traceback (most recent call last): File "", line 1, in TypeError: 'set' object does not support indexing

或者使用切片修改它们：

>>> s[0:2]Traceback (most recent call last): File "", line 1, in TypeError: 'set' object is not subscriptable

可是，如果我们需要删除重复项，或者进行组合列表(与)之类的数学运算，那么我们可以，并且应该始终使用集合。

我不克不及不提一下，在迭代时，集合的表示优于列表。所以，如果你需要它，那就加深对它的喜爱吧。为什么？好吧，这篇文章其实不筹算解释集合的内部工作原理，可是如果你感兴趣的话，这里有几个链接，你可以阅读它：

时间复杂度set() 是如何实现的？Python 集合 vs 列表在列表中使用集合是否有任何优势或劣势，以确保唯一无二的列表条目？

没有重复项

写这篇文章的时候，我总是不断地思考，我经常使用 for 循环和 if 语句检查并删除列表中的重复元素。记得那时我的脸红了，并且不止一次，我写了类似这样的代码：

>>> my_list = [1, 2, 3, 2, 3, 4]>>> no_duplicate_list = []>>> for item in my_list:... if item not in no_duplicate_list:... no_duplicate_list.append(item)...>>> no_duplicate_list[1, 2, 3, 4]

或者使用列表解析：

>>> my_list = [1, 2, 3, 2, 3, 4]>>> no_duplicate_list = []>>> [no_duplicate_list.append(item) for item in my_list if item not in no_duplicate_list][None, None, None, None]>>> no_duplicate_list[1, 2, 3, 4]

但没关系，因为我们现在有了武器装备，没有什么比这更重要的了：

>>> my_list = [1, 2, 3, 2, 3, 4]>>> no_duplicate_list = list(set(my_list))>>> no_duplicate_list[1, 2, 3, 4]>>>

现在让我们使用 timeit 模块，查看列表和集合在删除重复项时的执行时间：

>>> from timeit import timeit>>> def no_duplicates(list):... no_duplicate_list = []... [no_duplicate_list.append(item) for item in list if item not in no_duplicate_list]... return no_duplicate_list...>>> # 首先，让我们看看列表的执行情况：>>> print(timeit('no_duplicates([1, 2, 3, 1, 7])', globals=globals(), number=1000))0.0018683355819786227>>> from timeit import timeit>>> # 使用集合:>>> print(timeit('list(set([1, 2, 3, 1, 2, 3, 4]))', number=1000))0.0010220493243764395>>> # 快速并且清洁 =)

使用集合而不是列表推导不但让我们编写更少的代码，并且还能让我们获得更具可读性和高性能的代码。

注意：请记住集合是无序的，因此无法包管在将它们转换回列表时，元素的顺序不变。

Python 之禅：

优美胜于丑恶

Beautiful is better than ugly.

明了胜于晦涩

Explicit is better than implicit.

简洁胜于复杂

Simple is better than complex.

扁平胜于嵌套

Flat is better than nested.

集合不正是这样美丽、明了、简单且扁平吗？

成员测试

每次我们使用 if 语句来检查一个元素，例如，它是否在列表中时，意味着你正在进行成员测试：

my_list = [1, 2, 3]>>> if 2 in my_list:... print('Yes, this is a membership test!')...Yes, this is a membership test!

在执行这些操作时，集合比列表更高效：

>>> from timeit import timeit>>> def in_test(iterable):... for i in range(1000):... if i in iterable:... pass...>>> timeit('in_test(iterable)',... setup="from __main__ import in_test; iterable = list(range(1000))",... number=1000)12.459663048726043>>> from timeit import timeit>>> def in_test(iterable):... for i in range(1000):... if i in iterable:... pass...>>> timeit('in_test(iterable)',... setup="from __main__ import in_test; iterable = set(range(1000))",... number=1000).12354438152988223

注意：上面的测试来自于这个 StackOverflow 话题。

因此，如果你在巨年夜的列表中进行这样的比较，测验考试将该列表转换为集合，它应该可以加快你的速度。

如何使用

现在你已经了解了集合是什么以及为什么你应该使用它，现在让我们快速浏览一下，看看我们如何修改和操作它。

添加元素

根据要添加的元素数量，我们要在 add() 和 update() 体例之间进行选择。

add() 适用于添加单个元素：

>>> s = {1, 2, 3}>>> s.add(4)>>> s{1, 2, 3, 4}

update() 适用于添加多个元素：

>>> s = {1, 2, 3}>>> s.update([2, 3, 4, 5, 6])>>> s{1, 2, 3, 4, 5, 6}

请记住，集合会移除重复项。

移除元素