算法设计第十三章随机算法 randomed algorithm1

最新推荐文章于 2025-04-23 10:53:50 发布

deeeeeeplearning

最新推荐文章于 2025-04-23 10:53:50 发布

阅读量426

点赞数

分类专栏： algorithm design

本文链接：https://blog.youkuaiyun.com/qq_42153494/article/details/117335739

版权

9 篇文章

订阅专栏

本文探讨了随机算法在解决复杂问题时的优势，如快速排序和最大割问题的随机化解决方案。介绍了蒙特卡洛和拉斯维加斯算法的差异，并详细阐述了随机快排的期望复杂度分析。此外，还深入讨论了散列法，包括通用散列函数的设计和完美散列的概念，以实现高效的内存管理和查找操作。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 introduction

用随机算法可以更简单的求解，求一个近似最优解即可。

随机算法的重要部分就是求解该算法解的期望以及根据Chernoff Bounds 求bound。

给定一张图G，将G分为两个sides，极大化两个sides之间的边数。
在这里插入图片描述

非常简单的随机蒙特卡洛 2-近似算法
将每个点随机地放入其中一个side。

共有 $e$ 条边，任意一条边在cut内的概率都是0.5，该算法produce a cut with expected size $\frac{e}{2}$ ，因此 $E(X)=\frac{e}{2}$

T(n)是长度为n的快速排序复杂度
最坏的情况每次选择的元素时最大或者最小的， $T (n) = T (1) + T (n - 1) + n - 1$ （ $n - 1$ 是比较大小产生的复杂度)，==> $T(n)=O(n^2)$
较好的情况，每次选择的元素接近中位数 $T(n)=T(\frac{n}{4})+T(3*\frac{n}{4})+n-1$ ==> $T (n) = O (n l o g n)$
随机选择pivot元素即为随机排序，选择到任意rank元素的概率为 $\frac{1}{n}$ 。
期望的复杂度为： $T(n)=\frac{1}{n}(T(1)+T(n-1)+n-1)+\frac{1}{n}(T(2)+T(n-2)+n-1)+\dots$ ==> $T (n) = O (a n l o g n + b)$

一个巨大的的可能元素的全域 $U$ ， $∣ U ∣ = n$ ，数据结构试图记录一个集合 $S\subset U$ , $∣ S ∣ = m$ ， $S$ 是非常小的一部分 $m\ll n$ 。
设计数据结构（数组 $T$ ）使得能够快速插入和删除S的元素，并且能够快速判定给定元素是否属于 $S$ 。
全域 $U$ 中每个元素对应一个位置时严重浪费内存。
设计一个函数h。存储 $k$ 到 $T [h (k)]$ ，造成冲突时，形成链表即可。
最坏的情况下，存在一个链表长度过长。我们采用随机函数类减少这种情况出现。

对任意的 $u,v\in U$ ,随机选择 $h\in \mathcal{H}$ 满足 $h (u) = h (v)$ 的概率不超过 $\frac{1}{|T|}$ 。
简洁的表示每一个 $\in \mathcal{H}$ ，对于每一个给定 $h\in \mathcal{H}$ 和 $u\in U$ ，能有效地计算 $h (u)$ 。

设计一个通用函数类

素数 $p$ 作为作为散列表 $T$ 的大小，把全域 $U$ 看成 $x=(x_1,x_2,\dots,x_r)$ 的向量集合
$a=(a_1,a_2,\dots,a_r)\in\mathcal{A}$ , $a_i\leq p-1$ , $\mathcal{H}=\{h_a:a\in {\mathcal{A}}\}$
$h_a(x)=(\sum_{i=1}^{r}a_ix_i)mod(p)$

在这里插入图片描述

使用两层hash函数通用hash函数。
如果有 $n_j$ 个keys都hash到位置 $j$ ，则 $S_j$ 的长度为 $m_j=n_j^2$
存储 $n$ 个元素，hash table 长度为 $n^2$ , 有 $C_n^2$ 个元素可能冲突，每一对冲突的概率为 $\frac{1}{n^2}$ 。 $E(\sum n_j^2)=E(n_j+2C_n^2)=n+2C_n^2\leq 2n$