归并

归并排序(分与治)
分:就是将一无序的序列运用二分思想从中分开,直到每组只有一个元素的时候,我们可以将它看成有序的,不用进行处理了。但如果一组数中有2个元素,将它们排序,小在左,大在右。如果超过2个元素,就继续进行递归拆分。
治:其实就是将拆分的元素合并起来,组成一个有序的序列。
例题:
a[5]={1,2,3,4,5},b[5]={6,7,8,9,10};
问如何将他们合并成一个有序的序列?
我们需要一个成c[10]来存放上面这10个元素。
首先我们将a中的1与b中的6比较,小的1存放在c[0]中,然后将a中的2与b中的6比较,小的存放在成c[1]中,依次进行…
其实归并排序也是一样,要将一个无序的序列拆分成两个有序的序列,再进行合并,也就是我们所说的治,拆分的过程我们用一个递归函数就可以完成,合并过程也用一个函数完成,模块化有利于查找问题。
拆分函数:

void MergeSort(int a[],int left,int right)
{

    if(left<right)
    {
        int mid=(right+left)/2;
        MergeSort(a,left,mid);
        MergeSort(a,mid+1,right);
        Merge(a,left,right,mid);
    }
}

合并函数:

void Merge(int a[],int left,int right,int mid)
{
    int i=0,j,k,l;
    int temp[right-left+1];
    k=left,l=mid+1;
    while(k<=mid&&l<=right)
    {
        if(a[k]>a[l])
        {
            temp[i++]=a[l++];
        }
        else
            temp[i++]=a[k++];
    }
    while(k<=mid)
    {
        temp[i++]=a[k++];
    }
    while(l<=right)
    {
        temp[i++]=a[l++];
    }
    i=0;
    for(j=left; j<=right; j++)
        a[j]=temp[i++];
}

需要注意的是:在合并函数的时候,排完序之后,得检查k与l的值,确保每个数都有序的存入了temp数组中。
归并在求逆序数中也有应用。
出个题目吧!
问题 A: 求逆序数
描述
在一个排列中,如果一对数的前后位置与大小顺序相反,即前面的数大于后面的数,那么它们就称为一个逆序。一个排列中逆序的总数就称为这个排列的逆序数。
现在,给你一个N个元素的序列,请你判断出它的逆序数是多少。
比如 1 3 2 的逆序数就是1。
格式
输入格式
第一行输入一个整数T表示测试数据的组数(1<=T<=5)
每组测试数据的每一行是一个整数N表示数列中共有N个元素(2〈=N〈=100000)
随后的一行共有N个整数Ai(0<=Ai<1000000000),表示数列中的所有元素。
数据保证在多组测试数据中,多于10万个数的测试数据最多只有一组。
输出格式
输出该数列的逆序数
样例
样例输入 Copy
2
2
1 1
3
1 3 2
样例输出 Copy
0
1
题目其实很简单,就是运用归并的思想,在比较的时候计数就行了。
代码如下:

#include<stdio.h>
long long int ans;
long long int temp[100001];
void Mergesort(long long int a[],long long int left,long long int right,long long int mid)
{
    int m=mid,n=right,k=0,j=mid+1,i=left;
    while(i<=m&&j<=n)
    {
        if(a[i]<=a[j])
            temp[k++]=a[i++];
        else
        {
            temp[k++]=a[j++];
            ans+=(mid-i+1);
        }
    }
    while(i<=m)
    {
        temp[k++]=a[i++];
    }
    while(j<=n)
    {
        temp[k++]=a[j++];
    }
    for(i=0; i<k; i++)
        a[left+i]=temp[i];
}
void Merge(long long int a[],long long int left,long long int right)
{
    long long int mid;
    if(left<right)
    {
        mid=(left+right)/2;
        Merge(a,left,mid);
        Merge(a,mid+1,right);
        Mergesort(a,left,right,mid);
    }
}
int main()
{
    long long int n,m,i,j;
    long long int a[100001];
    scanf("%lld",&n);
    while(n--)
    {
        scanf("%lld",&m);
        for(i=0; i<m; i++)
        {
            scanf("%lld",&a[i]);
        }
        ans=0;
        Merge(a,0,m-1);
        printf("%lld\n",ans);
    }
    return 0;
}

归并的优缺点:归并排序不仅速度快,而且稳定,这与快排不一样,尽管快排被认为是最快的,但是不稳定,所以归并排序就是“稳!准!恨!”,但是缺点是用空间换去时间,因为用了递归。

最佳归并树是将若干个有序序列合并成一个有序序列的一种方式,使得所有合并操作的总代价最小的一棵二叉树,也被称为哈夫曼树,代价通常指合并两个有序序列的操作次数或比较次数。它用于组织归并段,可在归并过程中最小化磁盘I/O次数[^1][^2]。 ### 构建算法 - **初始归并段的准备**:把外部数据分成可加载到内存的小块,对每个小块进行内部排序,形成初始归并段[^1]。 - **构建归并树**:依据初始归并段的长度或占用的磁盘块数量,构建一棵类似哈夫曼树的归并树。构建时,每次选择两个长度最小的归并段进行归并,形成新的归并段,并将其长度或占用的磁盘块数量作为新节点的权值[^1]。 - **调整与优化**:构建过程中,若初始归并段的数量不是k的整数倍,需补充一些长度为0的“虚段”来构成严格的k叉树,以确保树的结构满足最佳归并的要求。对于k路归并,设度为k的结点有$n_k$个,度为0的结点有$n_0$个,归并树总结点数为$n$,初始归并段数量加上虚段数量等于$n_0$。若(初始归并段数量 - 1) % (k - 1) = 0,说明刚好能构成严格k叉树,无需添加虚段;若(初始归并段数量 - 1) % (k - 1) = u ≠ 0,则需补充(k - 1) - u个虚段[^1][^3]。 ### 性质与特点 - **最小化I/O次数**:通过优化归并段的组织方式,使整个归并过程的总I/O次数最小。归并过程中的磁盘读写次数等于归并树的带权路径长度(WPL)乘以2,将归并树构造成哈夫曼树,可使读写磁盘次数最少[^1][^3]。 - **灵活性**:能适应不同数量的初始归并段和不同的归并路数(k值)[^1]。 - **高效性**:构建过程中可利用败者树等高效的算法和数据结构来加速归并过程[^1]。 ### 应用场景 在外部排序中,由于内存空间有限,需要对大量数据进行归并操作。初始归并段往往长度不等,使用最佳归并树可以有效减少磁盘I/O次数,提高排序效率。例如,当使用置换 - 选择排序初始化出更长但不等长的归并段后,利用最佳归并树对这些归并段进行归并,能显著降低磁盘读写次数,提升整体性能[^1][^3][^4]。 ### 代码示例 ```python import heapq from collections import defaultdict def build_optimal_merge_tree(merge_segments, k): # 计算需要补充的虚段数量 n = len(merge_segments) u = (n - 1) % (k - 1) if u != 0: num_dummy = (k - 1) - u merge_segments.extend([0] * num_dummy) # 使用最小堆来构建最佳归并树 heapq.heapify(merge_segments) while len(merge_segments) > 1: new_segment = 0 for _ in range(k): if merge_segments: new_segment += heapq.heappop(merge_segments) heapq.heappush(merge_segments, new_segment) return merge_segments[0] # 示例归并段 merge_segments = [2, 5, 1, 6, 2] k = 2 # 归并路数 total_cost = build_optimal_merge_tree(merge_segments, k) print("最佳归并树的总代价:", total_cost) ```
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值