归并排序笔记

最新推荐文章于 2024-03-14 21:24:04 发布

稻城亚丁

最新推荐文章于 2024-03-14 21:24:04 发布

阅读量253

点赞数 2

分类专栏：算法基础文章标签：排序算法算法

本文链接：https://blog.youkuaiyun.com/weixin_44798365/article/details/121011387

版权

算法基础专栏收录该内容

25 篇文章

订阅专栏

代码模板

#include <iostream>
using namespace std;

const int N=1000010;

int n;
int q[N],tmp[N];

void merge_sort(int q[], int l, int r)
{
    //递归的终止情况
    if(l >= r) return;

    //第一步：分成子问题
    int mid = l + r >> 1;

    //第二步：递归处理子问题
    merge_sort(q, l, mid ), merge_sort(q, mid + 1, r);

    //第三步：合并子问题
    int k = 0, i = l, j = mid + 1, tmp[r - l + 1];
    while(i <= mid && j <= r)
        if(q[i] <= q[j]) tmp[k++] = q[i++];
        else tmp[k++] = q[j++];
    while(i <= mid) tmp[k++] = q[i++];
    while(j <= r) tmp[k++] = q[j++];

    for(k = 0, i = l; i <= r; k++, i++) q[i] = tmp[k];
}


int main()
{
    scanf("%d",&n);
    for(int i=0;i<n;i++) scanf("%d",&q[i]);
    
    merge_sort(q,0,n-1);
    
    for(int i=0;i<n;i++) printf("%d ",q[i]);
    return 0;
}
作者：yxc
链接：https://www.acwing.com
来源：AcWing
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

归并属于分治算法，有三个步骤

void merge_sort(int q[], int l, int r)
{
//递归的终止情况
if(l >= r) return;

//第一步：分成子问题
int mid = l + r >> 1;

//第二步：递归处理子问题
merge_sort(q, l, mid ), merge_sort(q, mid + 1, r);

//第三步：合并子问题
int k = 0, i = l, j = mid + 1, tmp[r - l + 1];
while(i <= mid && j <= r)
if(q[i] <= q[j]) tmp[k++] = q[i++];
else tmp[k++] = q[j++];
while(i <= mid) tmp[k++] = q[i++];
while(j <= r) tmp[k++] = q[j++];

for(k = 0, i = l; i <= r; k++, i++) q[i] = tmp[k];
}
待证问题: tmp 保存的是 q[l..mid] , q[mid+1..r] 中从小到大排序的所有数
证明(第一个 while 循环)
循环不变式: tmp[0..k-1] 保存上述俩数组中从小到大排序的最小 k 个数

初始

k = 0, tmp[0..k-1] 为空，显然成立

保持

假设某轮循环开始之前，循环不变式成立

若 q[i] <= q[j], 则 tmp[k] = q[i]

其中, q[i] <= q[i+1..mid], q[i] <= q[j] <= q[j+1..r]

∴ q[i] 是剩下的所有数中最小的一个

当 q[i] > q[j] 时，同理可以得到 tmp[k] = q[j] 是剩下数中最小的一个

∴ tmp[k] 是剩下数中最小的一个

∴ k自增之后，下轮循环开始之前，tmp[0..k-1]保存从小到大排序的最小k个数

终止

i > mid 或 j > r

则 q[l..mid] 和 q[mid+1..r] 其中一个数组的数都已遍历

tmp[0..k-1]保存从小到大排序的最小k个数

边界分析
为什么不用 mid - 1 作为分隔线呢

即 merge_sort(q, l, mid - 1 ), merge_sort(q, mid, r)

因为 mid = l + r >> 1 是向下取整，mid 有可能取到 l (数组只有两个数时)，造成无限划分

解决办法: mid 向上取整就可以了, 即 mid = l + r + 1 >> 1,如下所示:

void merge_sort(int q[], int l, int r)
{
if(l >= r) return;

int mid = l + r + 1>> 1;//注意mid是向上取整
merge_sort(q, l, mid - 1 ), merge_sort(q, mid, r);

int k = 0, i = l, j = mid, tmp[r - l + 1];
while(i < mid && j <= r)
if(q[i] <= q[j]) tmp[k++] = q[i++];
else tmp[k++] = q[j++];
while(i < mid) tmp[k++] = q[i++];
while(j <= r) tmp[k++] = q[j++];

for(k = 0, i = l; i <= r; k++, i++) q[i] = tmp[k];

}
不过最好不要这样写,很奇葩,不对称

为什么用 mid 作为分隔线时不会造成无限划分呢

因为此时 mid 是向下取整的, merge_sort(q, l, mid ) 中的 mid 一定不会取到 r 值

∴ merge_sort(q, l, mid ) 不会无限划分

摊还分析
摊还分析是一种分析时间复杂度的方法

主要有三种:

聚合分析(记账法)
核方法
势能法
聚合分析(记账法)最符合直观感觉,

聚合分析归并排序的时间复杂度
归并排序属于分治法, 很容易写出递归式:

T(n)=2T(n/2)+f(n)T(n)=2T(n/2)+f(n)
其中, 2T(n/2)2T(n/2) 是子问题的时间复杂度, f(n)f(n) 是合并子问题的时间复杂度

1.直观

直观上我们感觉 f(n)=O(n)f(n)=O(n), 事实也正是如何, 因为每次 while 都会把一个元素添加到数组中, 一共有 n 个元素, 所以 while 循环的次数为 n , 时间复杂度为 O(n)O(n)
2.摊还分析的聚合分析

对于每次迭代中选出并添加到数组中的元素, 我们给它的摊还代价设为 1(记账为 1)

一个元素只能计费一次, 因为马上就被添加到数组中了

一共有 n 个元素, 所以摊还总代价为 n, 算法的时间复杂度为 O(n)O(n)
摊还代价, 我们自己设定的一个理想代价, 只有一个要求: 总的摊还代价大于总的实际代价, 所以总摊还代价是总实际代价的上界

实际代价, 实际操作的代价

3.计算归并排序的递归式

得到 f(n)=O(n)f(n)=O(n) 后, 根据递推式的计算方法(代入法, 递归树法, 主方法)容易计算出 T(n)=O(nlogn)T(n)=O(nlog⁡n), 即归并排序的时间复杂度为 O(nlogn)

题目描述
给定一个长度为n的整数数列，请你计算数列中的逆序对的数量。

逆序对的定义如下：对于数列的第 i 个和第 j 个元素，如果满 i < j 且 a[i] > a[j]，则其为一个逆序对；否则不是。

输入格式
第一行包含整数n，表示数列的长度。

第二行包含 n 个整数，表示整个数列。

输出格式
输出一个整数，表示逆序对的个数。

数据范围
1≤n≤1000001≤n≤100000
输入样例：
6
2 3 4 5 6 1
输出样例：
5
解题报告
题意理解
这道题目就是让我们求解一个数组中的逆序对个数.

算法处理
求解逆序对问题,实际上有三种算法可以处理,分别是冒泡算法,归并排序,以及树状数组求解.

这里显然我们可以用性价比最高,代码最好写,效率特高的归并排序算法.

关于归并排序算法,各位看官可以点击这里哦

我们要注意一点,就是当我们发现填充第二个数组中的数,加入备用数组的使用,都要统计mid−i+1mid−i+1,因为此时此刻,我们第一个数组中剩余的所有数,都会和它构成逆序对.

代码求解：

#include <iostream>
using namespace std;

const int N=100010;
int n;
typedef long long LL;
int q[N],tmp[N];

LL merge_sort(int l,int r)
{
    if(l>=r) return 0;
    int mid=l+r>>1;
    LL res=merge_sort(l,mid)+merge_sort(mid+1,r);
    
    //归并的过程
    int k=0,i=l,j=mid+1;
    while(i<=mid&&j<=r)
        if(q[i]<=q[j]) tmp[k++]=q[i++];
        else{
            //数组q剩下了的都比q（i）大的数组
            tmp[k++]=q[j++];
            res+=mid-i+1;
        }
    //扫尾
    while(i<=mid) tmp[k++]=q[i++];
    while(j<=r) tmp[k++]=q[j++];
    
    //物归原主
    for(int i=l,j=0;i<=r;i++,j++) q[i]=tmp[j];
    return res;
    
}

int main()
{
    cin >> n;
    for(int i=0;i<n;i++) cin >> q[i];
    cout << merge_sort(0,n-1) <<endl;
    return 0;
}