剑指offer-5-面试36:数组中的逆序对(时间效率和空间效率的平衡)

本文介绍了一种使用归并排序思想统计数组中逆序对的方法。通过对数组进行分治,先计算子数组内的逆序对,再处理相邻子数组间的逆序对,从而在O(nlogn)的时间复杂度内完成任务。此外,文章还讨论了如何在处理过程中避免重复计数,以及如何在空间和时间效率之间取得平衡。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目

在数组中的两个数字如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。输入一个数组,求出这个数组中的逆序对的总数。

分析

看到这个题目,我们第一反应是顺序扫描整个数组。每扫描到一个数字的时候,逐个比较该数字和它后面的数字的大小。如果后面的数字比它小,则这两个数字就组成了一个逆序对。假设数组中含有 n 个数字。由于每个数字都要和O(n)个数字作比较,因此这个算法的时间复杂度是O(n^2)。

以数组 { 7,5,6,4 } 为例来分析统计逆序对的过程。每次扫描一个数字的时候,我们不能拿它和后面的每一个数字作比较,否则时间复杂度就是O(n^2),因此我们可以考虑先比较两个相邻的数字。
这里写图片描述
如图5.1(a)和5.1(b)所示,先把数组分解成两个长度为 2 的子数组,再把这两个子数组分别拆分成两个长度为 1 的数组。接下来一边合并相邻的子数组,一边统计逆序对的数目。在第一对长度为 1 的子数组 {7}、{5}中 7大于 5,因此(7,5)组成一个逆序对。同样在第二对长度为 1 的子数组 {6}、{4}中也有逆序对(6,4)。由于我们已经统计了这两对子数组内部的逆序对,因此需要把这两对子数组排序(图5.1(c)所示),以免在以后的统计过程中再重复统计。
这里写图片描述

注:图中省略了最后一步,即复制第二个子数组最后剩余的 4 到辅助数组中。
(a)P1指向的数字大于P2指向的数字,表明数组中存在逆序对。P2指向的数字是第二个子数组的第二个数字,因此第二个子数组中有两个数字比7小。把逆序对数目加 2, 并把 7复制到辅助数组,向前移动 P1和P3。
(b)P1指向的数字小于P2指向的数字,没有逆序对。把P2指向的数字复制到辅助数组,并向前移动P2和P3。
(c)P1指向的数字大于P2指向的数字,因此存在逆序对。由于P2指向的数字是第二个子数组的第一个数字,子数组中只有一个数字比 5 小。把逆序对数目加 1,并把 5 复制到辅助数组,向前移动 P1和P3。

接下来统计两个长度为2的子数组之间的逆序对。在图 5.2中细分图 5.1(d)的合并子数组及统计逆序对的过程。
先用两个指针分别指向两个子数组的末尾,并每次比较两个指针指向的数字。如果第一个子数组中的数字大于第二个子数组中的数字,则构成逆序对,并且逆序对的数目等于第二个子数组中剩余数字的个数(如图5.2(a)和图5.2(c)所示)。如果第一个数组中的数字小于或等于第二个数组中的数字,则不构成逆序对(如图5.2(b)所示)。每一次比较的时候,我们都把较大的数字从后往前复制到一个辅助数组中去,确保辅助数组中的数字是递增排序的。在把较大的数字复制到辅助数组之后,把对应的指针向前移动一位,接下来进行下一轮比较。

经过前面的讨论,总结出统计逆序对的过程:先把数组分隔成子数组,先统计出子数组内部的逆序对的数目,然后再统计出两个相邻子数组之间的逆序对的数目。在统计逆序对的过程中,还需要对数组进行排序。


int InversePairs(int* data, int length)
{
    if(data == NULL || length < 0)
        return 0;

    int* copy = new int[length];
    for(int i = 0; i < length; ++ i)
        copy[i] = data[i];

    int count = InversePairsCore(data, copy, 0, length - 1);
    delete[] copy;

    return count;
}

int InversePairsCore(int* data, int* copy, int start, int end)
{
    if(start == end)
    {
        copy[start] = data[start];
        return 0;
    }

    int length = (end - start) / 2;

    int left = InversePairsCore(copy, data, start, start + length);
    int right = InversePairsCore(copy, data, start + length + 1, end);

    // i初始化为前半段最后一个数字的下标
    int i = start + length; 
    // j初始化为后半段最后一个数字的下标
    int j = end; 
    int indexCopy = end;
    int count = 0;
    while(i >= start && j >= start + length + 1)
    {
        if(data[i] > data[j])
        {
            copy[indexCopy--] = data[i--];
            count += j - start - length;
        }
        else
        {
            copy[indexCopy--] = data[j--];
        }
    }

    for(; i >= start; --i)
        copy[indexCopy--] = data[i];

    for(; j >= start + length + 1; --j)
        copy[indexCopy--] = data[j];

    return left + right + count;
}

归并排序的时间复杂度是O(nlogn),比最直观的O(n^2)要快,但同时归并排序,需要一个长度为n的辅助数组,相当于我们用O(n)的空间消耗换来了时间效率的提升,因此这是一种用空间换时间的算法。

测试用例&代码

(1)功能测试(输入未经排序的数组、递增排序的数组、递减排序的数组,输入的数组中包含重复的数字)。

(2)边界值测试(输入的数组中只有两个数字、输入的数组中有一个数字)

(3)特殊输入测试(表示数组的指针为NULL指针)

本题考点

(1)分析复杂问题的能力。统计逆序对的过程很复杂,如何发现逆序对的规律,是应聘者解决这个题目的关键。

(2)考查应聘者对归并排序的掌握程度。如果应聘者在分析统计逆序对的过程中发现问题与归并排序的相似性,并能基于归并排序形成解题思路,那通过面试的几率就很高了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值