[算法导论][练习题]2.2

最新推荐文章于 2023-07-12 14:11:23 发布

原创最新推荐文章于 2023-07-12 14:11:23 发布 · 290 阅读

1 ·

CC 4.0 BY-SA版权

算法导论专栏收录该内容

11 篇文章

订阅专栏

本文探讨了选择排序算法的实现及其复杂度分析，并对比了线性查找算法的不同情况下的运行时间。

2.2-1

用 $Θ\Theta$ 记号表示函数 $n^3 / 1000 - 100n^2 - 100n + 3$ 。

答：
$Θ(n3)\Theta(n^3)$

2.2-2

考虑排序存储在数组 $A$ 中的 $n$ 个数：首先找出 $A$ 中的最小元素并将其与 $A [1]$ 中的元素进行交换。接着，找出 $A$ 中次最小元素并将其与 $A [2]$ 中的元素进行交换。对 $A$ 中前 $n - 1$ 个元素按该方式继续。该算法称为选择算法，写出其伪代码。该算法维持的循环不变式是什么？为什么它只需要对前 $n - 1$ 个元素，而不是对所有 $n$ 个元素运行？用 $Θ\Theta$ 记号给出选择排序的最好情况与最坏情况运行时间。

答：

伪代码：

SELECTION-SORT(A)
	n = A.length
	for i = 1 to n - 1
		minIndex = i
		for j = i + 1 to n
			if A[minIndex] > A[j]
				minIndex = j
		swap(A[i], A[minIndex])

c#代码

static void SelectionSort(int[] A)
{
	for(int i = 0; i < A.Length - 1; i++)
	{
		int minIndex = i;
		for(int j = i + 1; j < A.Length; j++)
		{
			if (A[minIndex] > A[j])
				minIndex = j;
		}

		int temp = A[i];
		A[i] = A[minIndex];
		A[minIndex] = temp;
	}
}

该算法维持的循环不变式是“f循环迭代每次开始之前，数组 $A [1 . . i - 1]$ 中的元素均为已排序好的元素”。
当 $i = = n - 1$ 时，数组 $A$ 中前 $n - 2$ 个元素均已排好序，而剩余未排序的元素只有 $A [n - 1]$ 和 $A [n]$ 这两个元素了。在内层for循环体内对这两个未排序元素进行了比较，并且将较小的元素保存在 $A [n - 1]$ 了，同时也就将两者中的较大的元素保存在 $A [n]$ 中了。这样，对于最后一次循环迭代（ $i = = n - 1$ ），会同时将数组 $A$ 中最后两个一同排序。所以，选择排序只需要对前 $n - 1$ 个元素而不是对所有 $n$ 个元素运行。
运行时间
为选择排序算法SELECTION-SORT(A)中每一行的设定执行代价，即第 $k$ 行的执行代价为 $c_k$ ，每行代码的执行情况如下所示：

代码	代价	执行次数
SELECTION-SORT(A)
n = A.length	$c_1$	$1$
for i = 1 to n - 1	$c_2$	$n$
minIndex = i	$c_3$	$n - 1$
for j = i + 1 to n	$c_4$	$∑j=2n(n−j+1)+1\sum_{j=2}^{n}(n-j+1)+1$
if A[minIndex] > A[j]	$c_5$	$∑j=2n(n−j+1)\sum_{j=2}^{n}(n-j+1)$
minIndex = j	$c_6$	$∑k=1n−1tk\sum_{k=1}^{n-1}t_k$ ，其中 $t_k$ 为在 $k = i$ 时此行的执行次数
swap(A[i], A[minIndex])	$c_7$	$n - 1$

$c_1 + c_2n + c_3(n - 1) + c_4(\sum_{j=2}^{n}(n-j+1)+1) + c_5\sum_{j=2}^{n}(n-j+1) + c_6\sum_{k=1}^{n-1}t_k + c_7(n-1)$
$=c4+c52n2+(c2+c3+c7−c4+c52)n+(c1−c3+c4−c7)+c6∑k=1n−1tk=\frac{c_4+c_5}{2}n_2 + (c_2+c_3+c_7-\frac{c_4+c_5}{2})n+(c_1-c_3+c_4-c_7) + c_6\sum_{k=1}^{n-1}t_k$
设 $a=c4+c52,b=c2+c3+c7−c4+c52,c=(c1−c3+c4−c7)a=\frac{c_4+c_5}{2}, b=c_2+c_3+c_7-\frac{c_4+c_5}{2}, c=(c_1-c_3+c_4-c_7)$ ，则
$an^2 + bn + c + c_6\sum_{k=1}^{n-1}t_k$

最好情况即为原数组中的元素已经按从小到大的顺序排序，则对于 $m i n I n d e x = j$ 这一句的执行因 $i f A [m i n I n d e x] > A [j]$ 判断不为真，而从来没用执行过。此时，当 $k = 1, 2, . . . n - 1$ 时， $t_k=0$ ，故
$T_1(n) = an^2 + bn + c$
所以
$Θ(T1(n))=Θ(n2)\Theta(T_1(n)) = \Theta(n^2)$

最坏情况即为原数组中的元素已经按从大到小的顺序排序，则对于 $m i n I n d e x = j$ 这一句的执行因 $i f A [m i n I n d e x] > A [j]$ 判断总是真，而一直都在执行。此时，当 $k = 1, 2, . . . n - 1$ 时， $t_k=n-1, n-2, ... 1$ ，故
$T2(n)=an2+bn+c+∑k=1n−1(n−k)T_2(n) = an^2 + bn + c + \sum_{k=1}^{n-1}{(n-k)}$
$=an2+bn+c+n(n−1)2=an^2+bn+c+\frac{n(n-1)}{2}$
$=2a+12n2+2b−12n+c=\frac{2a+1}{2}n^2 + \frac{2b-1}{2}n+c$
设 $a^{'} = 2 a + 1, b^{'} = 2 b - 1$ ，则
$T_2(n)=a'n^2+b'n+c$
所以
$Θ(T2(n))=Θ(n2)\Theta(T_2(n)) = \Theta(n^2)$

综上所述，最好情况与最坏情况的运行时间均为 $Θ(T(n))=Θ(n2)\Theta(T(n))=\Theta(n^2)$ 。

2.2-3

再次考虑线性查找问题（参见练习2.1-3）。假定要查找的元素等可能地为数组中地任意元素，平均需要检查输入序列的多少元素？最坏情况又如何呢？用 $Θ\Theta$ 记号给出线性查找的平均情况和最坏情况运行时间。证明你的答案。

答：
线性查找算法伪代码：

LINEAR-SEARCH(A, v)
	for i = 1 to A.length
		if A[i] == v
			return i
	return NIL

代码	代价	执行次数
LINEAR-SEARCH(A, v)
for i = 1 to A.length	$c_1$	$n + 1$
if A[i] == v	$c_2$	$n$
return i	$c_3$	$1$
return NIL	$c_4$	$1$

线性查找算法的运行时间
$T (n) = (n + 1) + n + 1 + 1$
$= 2 n + 3$

在平均情况下，需要检查输入序列一半的元素。此时
$T1(n)=(n2+1)+n2+1+1T_1(n) = (\frac{n}{2} + 1) + \frac{n}{2} + 1 + 1$
$= n + 3$
故，运行时间
$Θ(T(n))=Θ(n)\Theta(T(n)) = \Theta(n)$
在最坏情况下，需要检查输入序列所有的元素。此时
$T_1(n) = (n + 1) + n + 1 + 1$
$= 2 n + 3$
故，运行时间
$Θ(T(n))=Θ(n)\Theta(T(n)) = \Theta(n)$