Medians and Order Statistics (次序统计)

最新推荐文章于 2025-05-30 13:40:08 发布

最新推荐文章于 2025-05-30 13:40:08 发布 · 481 阅读

文章标签：

#prototype #算法 #XHTML

algorithm 专栏收录该内容

21 篇文章

订阅专栏

本文介绍如何通过快速排序的变种算法高效地找出数组中的中位数及任一指定次序的元素。讨论了分组策略及其时间复杂度，并提供了一个具体的JavaScript实现案例。

[b]Medians and Order Statistics[/b]

------
[b]概述[/b]

Order Statistics:
次序统计，即找出 n 个数中排在第 i 位的那个数，记为 ith

Medians:
中位数，排在中间的数，

------
[b]Medians 的取值[/b]

假设所有的数都不相同，则：
n = odd 时，只有1个中间数，i = (n+1)/2,
n = even 时，有2个中间数，i = n/2 和 i = n/2 + 1,

可以合并为：
i =
lower((n + 1)/2),
upper((n + 1)/2),
对于 odd 2者相同，对于 even 2者不同，

------
[b]最大 & 最小值[/b]

通过 n-1 次比较可以找出最大或最小值，
如果要同时找2者，则可以合并一下，让比较次数小于 2*(n-1),因为如果一个数比另1个数小，则该数必定不是最大值，反之亦然，

------
[b]次序查找 - 每次分割2组实现[/b]

概述：
通过分隔函数实现查找，

效率：
时间复杂度：预期效率是 O(n)
空间复杂度： O(n)

思路：
基于 quicksort 改造，但每次只取其中的一半，从而效率降低到 O(n),

分隔函数的逻辑：
* 取分隔值，
* 如果分隔值就是目标值，则 ok
* 否则将数组分隔为左右2个，
* 判断目标数在哪个数组内，保留那个数组，对其循环调用分隔函数
*

时间复杂度证明：
略，看 <算法导论> chp9.2

------
[b]次序查找 - 每组5个分割实现[/b]

较为复杂，最差情况下时间复杂度为 O(n)，

参考：<算法导论> chp9.3

------
[b]例子：[/b]

([b]顺序号查找 - 每次分割2组实现[/b])

* js(order_statistic.js)


var arr_order_statistic = [ 78, 13, 6, 177, 26, 90, 288, 45, 62, 83 ];

/**
 * <p>
 * order statistic , 找出排序为 i 的值
 * </p>
 * <b>思路：</b><br />
 * 基于 quicksort 改造，但每次只取其中的一半，从而效率降低到 O(n),<br />
 * 
 * <pre>
 * 分隔函数的逻辑：
 * 	取分隔值，
 * 	如果分隔值就是目标值，则 ok
 * 	否则 将数组分隔为 左右2个，
 * 	判断目标数在哪个数组内，保留那个数组，对其循环调用分隔函数
 * </pre>
 * 
 * <b>时间复杂度：</b>O(n)<br />
 * <b>空间复杂度：</b>O(n)<br />
 * 
 * @author kuchaguangjie
 * @date 2011年1月3日
 * @return
 */
function OrderStatistic(inputArr) {
	this.inputArr = inputArr;
}
/**
 * 单次分隔
 * 
 * @param arr
 * @param i
 *            在 arr 中的排序，从 0 开始
 * @return 存有目标值的子数组 或 目标值
 */
OrderStatistic.prototype.partitionSingle = function(arr, i) {
	if (arr.length <= 1) { // length == 1 的情况，length == 0 应该在上层函数中排除掉，
		return new OrderStaticResult(true, undefined, undefined, arr[0]);
	}
	var partLeftArr = [];
	var partRightArr = [];
	var partMiddle = arr[arr.length - 1]; // 最后1个元素，用作分隔值
	for ( var x = 0; x < arr.length - 1; x++) {
		if (arr[x] <= partMiddle) {
			partLeftArr[partLeftArr.length] = arr[x];
		} else {
			partRightArr[partRightArr.length] = arr[x];
		}
	}
	if (partLeftArr.length == i) { // 分隔值 即是 目标值
		return new OrderStaticResult(true, undefined, undefined, partMiddle);
	} else if (partLeftArr.length > i) { // 目标值 在 左子数组
		return new OrderStaticResult(false, partLeftArr, i);
	} else { // 目标值 在 右子数组
		i -= (partLeftArr.length + 1); // 调整 i
		return new OrderStaticResult(false, partRightArr, i);
	}
};
/**
 * 分隔函数，直到找到目标值为之
 * 
 * @param i
 * @return
 */
OrderStatistic.prototype.partition = function(i) {
	var arr = this.inputArr;
	var osr;
	while (true) {
		osr = this.partitionSingle(arr, i);
		if (osr.ok) {
			return osr.v;
		} else {
			arr = osr.subArr;
			i = osr.i;
		}
	}
};
/**
 * 根据 排序号 找到数
 * 
 * @param order
 *            排序号，从 1 开始
 * @return
 */
OrderStatistic.prototype.getByOrder = function(order) {
	if (this.inputArr.length == 0 || this.inputArr.length < order) {
		alert('输入有误！');
	} else {
		var i = order - 1; // index 从 0 开始，而顺序号是从 1 开始，这里做调整
		return this.partition(i);
	}
};

/**
 * 单次 分隔计算 后的返回值
 * 
 * @param ok
 *            boolean 值，表示 是否已找到
 * @param subArr
 *            目标值所在的子数组，当 ok = false 时，采用此数组
 * @param i
 *            目标值在的子数组中的排序，从 0 开始，当 ok = false 时，采用此值
 * @param v
 *            目标值，当 ok = true 时，才用此值
 * @return
 */
function OrderStaticResult(ok, subArr, i, v) {
	this.ok = ok;
	this.subArr = subArr;
	this.i = i;
	this.v = v;
}

* html


<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<script type="text/javascript" src="js/order_statistic.js"></script>
</head>
<body>
<input type="button" value="order statistic" onclick="var i = 6;alert(arr_order_statistic + ' 中，\n排在第'+ i +'位的是： '+ new OrderStatistic(arr_order_statistic).getByOrder(i));" />
</body>
</html>

*

------