Python寻找两个有序数组的中位数

本文深入探讨了在两个已排序数组中查找中位数的高效算法,利用二分查找原理,通过递归方式实现。文章详细解析了算法步骤,包括确定中位数位置、比较并调整搜索范围等关键环节,最终提供了Python实现代码。

Python寻找两个有序数组的中位数

审题:

  1. 找出意味着这是一个查找算法题
  2. 算法复杂度log级别,就是提示你是二分查找
  3. 二分查找实现一般为递归
    (1)递归包括递归体
    (2)终止条件

思路:

定理:

  1. 有序数组中有一半的元素小于等于数组的中位数,有一半的元素大于等于中位数(如果数组中元素个数是奇数,那么这里的一半并不是严格意义的1/2)
  2. 如果我们去掉其中一个数组比中位数小的k个数,再去掉另一个数组中比中位数大的k个数,得到的合并子数组的中位数和原来的中位数相同。
    eg:[1,2,3],[1,2,3] => [1,1,2,2,3,3]
    根据定理去除元素[2,3],[1,2] => [1,2,2,3]中位数没变。我用了特殊的例子解释,你可以自行换一个试一试。如果两个的数组长度不一样的时候,不能去掉各自的一半,要去掉相同的个数,下面会细说

解题思路:

假设两个数组的中位数分别是a[m1],b[m2]

  1. if a[m1] == b[m2] ,那么刚好有一半的元素小于a[m1],那么a[m1]就是要找的中位数。参考上面的列子
  2. if a[m1] < b[m2],根据定理1可知,这个中位数只可能出现在a[n1/2 ~ n1-1]或者b[0 ~ n2/2].也就是说合并这两个数组的中位数和原来的数组合并的数组的中位数是一样的。 根据定理2可知:
    1.数组长度一样的时候,去除掉一半是合理的。
    2.数组长度不一样,这么做中位数可能发生变化。解决方案就是去除掉相同个数的元素。why?假设n1 < n2, 两个数组就去掉n1/2个元素。那就不在是上面的范围(a[n1/2 ~ n1-1]或者b[0 ~ n2/2]),而是a[n1/2 ~ n1-1]或者b[0 ~ (-n1/2+n2-1)].
    结论就是:只能删除a的n1/2(向下取整)
  3. if a[m1] > b[m2],和上面分析类似,中位数只能出现在a的前半段或者b的后半段。也就是说a[0 ~ n1/2]和b[n1/2 ~ n2-1]的中位数和原来的中位数相同。

参考:LeetCode参考答案

class Solution:
    def findMedianSortedArrays(self, nums1, nums2):
        """
        :type nums1: List[int]
        :type nums2: List[int]
        :rtype: float
        """
        m, n = len(nums1), len(nums2)
        if m > n:
            nums1, nums2, m, n = nums2, nums1, n, m
        if n == 0:
            raise ValueError

        imin, imax, half_len = 0, m, (m + n + 1) // 2
        while imin <= imax:
            i = (imin + imax) // 2
            j = half_len - i
            if i < m and nums2[j-1] > nums1[i]:
                # i is too small, must increase it
                imin = i + 1
            elif i > 0 and nums1[i-1] > nums2[j]:
                # i is too big, must decrease it
                imax = i - 1
            else:
                # i is perfect

                if i == 0: max_of_left = nums2[j-1]
                elif j == 0: max_of_left = nums1[i-1]
                else: max_of_left = max(nums1[i-1], nums2[j-1])

                if (m + n) % 2 == 1:
                    return max_of_left

                if i == m: min_of_right = nums2[j]
                elif j == n: min_of_right = nums1[i]
                else: min_of_right = min(nums1[i], nums2[j])

                return (max_of_left + min_of_right) / 2.0
<think>好的,我需要解决用户提出的两个有序数组中位数问题。首先,用户希望得到算法和代码示例,所以我要先理解问题,再整理解决思路。 根据用户提供的引用,特别是引用[2]和[3],提到了合并排序法和二分法,其中二分法的时间复杂度是O(log(m+n)),这更高效。用户可能已经知道合并排序法,但更想了解高效的解法,所以应该重点讲二分法。 首先,我需要回忆中位数的定义:对于合并后的有序数组,如果长度是奇数,中位数是中间的数;如果是偶数,是中间两个数的平均值。直接合并数组虽然可行,但时间复杂度是O(m+n),不符合要求。而题目要求O(log(m+n)),所以必须用二分查找优化。 接下来,我需要分解二分法的步骤。核心思想是将两个数组分别分成左右两部分,使得左边的元素都小于右边的元素,并且左右两边的元素数量相等或差一。具体来说,假设数组A和B,分别在i和j的位置分割,使得i + j = (m + n + 1)/2 - 1,且A[i-1] <= B[j]和B[j-1] <= A[i]。然后根据奇偶情况计算中位数。 需要处理边界情况,比如当i为0或j为0时,某个数组的所有元素都在左边或右边。这部分容易出错,要特别注意。 然后考虑代码实现。通常使用较短的数组进行二分查找,以减少时间复杂度。初始化两个指针low和high,逐步调整分割位置,直到满足条件。最后根据分割点附近的元素计算中位数。 还要考虑代码的正确性,比如测试用例是否覆盖奇偶长度、数组为空的情况等。例如,当其中一个数组完全在另一个数组的左边或右边时,分割点是否正确。 最后,用户可能需要代码示例,所以需要用Python或其他语言实现,并添加注释说明关键步骤。同时,根据引用中的信息,用户可能对归并排序的方法感兴趣,但需要指出其时间复杂度的不足,而推荐更优的二分法。 总结步骤:明确问题,分析时间复杂度需求,介绍二分法的思路,处理边界条件,给出代码示例,并比较不同方法的优劣。同时,根据用户提供的引用,适当引用相关内容,如合并排序法的例子,但强调二分法的优势。</think>### 求解两个有序数组合并后中位数的算法及代码示例 #### 问题分析 中位数的定义是:将两个有序数组合并后的有序数组中,位于中间位置的数(若合并后长度为奇数)或中间两个数的平均值(若长度为偶数)。直接合并数组再取中位数的算法时间复杂度为 $O(m+n)$,但通过二分法可优化至 $O(\log(m+n))$[^2][^3]。 --- #### 算法思路(二分法) 1. **核心思想**: 将两个数组 $A$ 和 $B$ 分别切割为左右两部分,使得左边部分的最大值小于等于右边部分的最小值,且左右部分元素数量相等或相差1。设分割点为 $i$(数组 $A$)和 $j$(数组 $B$),满足 $i + j = \frac{m + n + 1}{2}$。 2. **边界条件**: - 若 $i=0$,则左边部分的最大值为 $B[j-1]$; - 若 $j=0$,则左边部分的最大值为 $A[i-1]$; - 若 $i=m$ 或 $j=n$,需判断右边部分的最小值。 3. **调整分割点**: 通过二分查找调整 $i$,使得 $A[i-1] \leq B[j]$ 且 $B[j-1] \leq A[i]$。 --- #### 代码实现(Python) ```python def findMedianSortedArrays(nums1, nums2): if len(nums1) > len(nums2): nums1, nums2 = nums2, nums1 # 确保nums1是较短的数组 m, n = len(nums1), len(nums2) low, high = 0, m while low <= high: i = (low + high) // 2 # nums1的分割点 j = (m + n + 1) // 2 - i # nums2的分割点 # 处理边界情况 max_left_A = float('-inf') if i == 0 else nums1[i-1] min_right_A = float('inf') if i == m else nums1[i] max_left_B = float('-inf') if j == 0 else nums2[j-1] min_right_B = float('inf') if j == n else nums2[j] # 判断分割是否满足条件 if max_left_A <= min_right_B and max_left_B <= min_right_A: if (m + n) % 2 == 1: return max(max_left_A, max_left_B) else: return (max(max_left_A, max_left_B) + min(min_right_A, min_right_B)) / 2 elif max_left_A > min_right_B: high = i - 1 # 向左调整分割点 else: low = i + 1 # 向右调整分割点 return 0.0 ``` --- #### 示例说明 假设 `nums1 = [1, 3]`,`nums2 = [2]`,合并后为 `[1, 2, 3]`,中位数为 `2`。算法执行步骤如下: 1. 初始化 `low=0`, `high=2`,计算 `i=1`, `j=1`; 2. 检查 `max_left_A=3` 是否 `<= min_right_B=2`?不满足,向左调整分割点; 3. 重新计算 `i=0`, `j=2`,检查条件满足; 4. 中位数为 `max(1, 2) = 2`。 --- #### 复杂度分析 - **时间复杂度**:$O(\log(\min(m, n)))$,因每次二分范围减半; - **空间复杂度**:$O(1)$,仅需常数空间。 --- #### 对比其他方法 - **合并排序法**:直接合并数组后取中位数,时间复杂度 $O(m+n)$[^1]; - **二分法**:无需合并数组,时间复杂度更优。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值