用 R 构建集合工具:从基础到应用
1. 集合基础概念
集合是对象的集合,这些对象通常被称为集合的元素。例如,美国参议院的参议员集合、同时抛掷两枚硬币的结果集合,以及智商超过 200 的所有狗的集合(这很可能是一个空集)。在数学中,我们通常使用括号来表示集合,用大写字母来表示集合的名称。例如,包含 -2 到 3 之间所有整数的集合可以表示为:
A <- c(-2, -1, 0, 1, 2, 3)
集合不能有重复元素。在本文中,我们首先将集合视为向量。
2. 文氏图
文氏图由 John Venn(生于 1834 年)使用,可以展示集合之间的各种关系。文氏图用于表示集合之间的关系,需要注意的是,图中标记为 I、II、III 和 IV 的区域可以是空的,也可以包含元素。仅仅因为显示了交集,并不意味着交集包含元素;交集实际上可能是空的,但仍然会显示出来。
3. 集合的基数
在大多数情况下,“基数”只是表示集合中元素数量的一个专业术语。在数据科学中,我们通常不需要处理无限集,所以对我们来说,基数就是集合中元素的数量。数学中表示集合 A 元素数量的一种符号是 n(A),另一种是 |A|。例如,如果 A <- c(-1, 0, 1) ,那么 n(A) = 3 。
我们可以编写一个函数来测量集合的基数:
# 创建一个集合 A
A <- c(1:8, "cat", "dog"
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



