离散化

离散化,把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。

通俗的说,离散化是在不改变数据相对大小的条件下,对数据进行相应的缩小。例如:

原数据:1,999,100000,15;处理后:1,3,4,2;

原数据:{100,200},{20,50000},{1,400};

处理后:{3,4},{2,6},{1,5};


有时候,我们要处理的数据范围非常大,但是数据量并不多,同时,我们需要知道的只是他们的相对大小关系,这时候,我们就可以对数据进行离散化处理。 比如现在在x轴上有n(n<100)个点,分别给出他们的坐标m(m<1e9),询问你在坐标k左边的坐标数量有多少。

如果m小的话,我们完全可以使用桶排解决,但是m如果1e9的话,开数组肯定会炸(不要问为什么不用map,每一种算法肯定有他存在的意义),这时候我们就可以先对数据离散化。


现在有数据1 2 2 7 8 9 100 200 199999 1000000000

离散化有两种较常用的方法

  • 第一种是将相等的数据离散化为相等的数据,上面的数据处理后的结果就是1 2 2 3 4 5 6 7 8 9
  • 第二种是将相等的数据离散化为不相等的数据,上面的数据处理后的结果就是1 2 3 4 5 6 7 8 9 10

第一种,该方法用到unique()和lower_bound(),

因为不难理解,直接上代码

    int n = 10;
    int a[12], b[12]; //b数组用来存放去重后的数据
    for (int i = 1; i <= n; i++)
    {
        cin >> a[i];
        b[i] = a[i];
    }
    sort(b + 1, b + 1 + n);//unique 和 lower_bound都需要有序序列
    int len = unique(b + 1, b + 1 + n) - b; //记录b数组去重后的长度
    for (int i = 1; i <= n; i++)
        a[i] = lower_bound(b + 1, b + len, a[i]) - b; //离散化 利用二分查找 快速重新赋值

第二种,只需开个结构体即可,仔细看一遍就可理解,直接上代码

    struct node
    {
        int v, bh; //v表示离散化前的值
    } p[15];
    bool cmp(node a, node b)
    {
        return a.v < b.v;
    }
    int a[105]; //用来存放离散化后的数据
    
    int n = 10;
    for (int i = 1; i <= n; i++)
    {
        p[i].bh = i;
        cin >> p[i].v;
    }
    sort(p + 1, p + n + 1, cmp); //按值大小排序
    for (int i = 1; i <= n; i++)
        a[p[i].bh] = i;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

hesorchen

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值