D. Salary Changing

本文介绍了一种使用二分查找算法解决薪资调整问题的方法。通过定义一个查找函数,根据给定的薪资范围和总薪资,算法能够在大规模数据中找到最佳的薪资调整方案。文章提供了完整的C++代码实现,并通过实例解释了算法的工作原理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

D. Salary Changing

题目链接
题目意思自己翻译。
题解我写过一遍的,被记事本和edge搞死了,总之就是二分,看不懂去其他家看看把,1点了,睡了!

#include<iostream>
#include<algorithm>
#include<queue>
using namespace std;

long long int t,n,l[200007],r[200007],s,ansm;

struct madoka{
    long long int l;
    long long int r;
    bool operator < (const madoka & a) const
    {
        return l>a.l;
    }
}lin;

priority_queue <madoka> ho;


int find(long long int k,long long int s){
    long long int lsum=0,rsum=0,sum=s;
    for(int i=1;i<=n;i++){
        if(k>r[i]){
            lsum++;
            sum-=l[i];
        }
        else if(k<l[i]){
            rsum++;
            sum-=l[i];
        }
        else{
            lin.l=l[i];
            lin.r=r[i];
            ho.push(lin);
        }
    }
    int m=n/2;
    while(!ho.empty()){
        if(lsum<m){
            lsum++;
            sum-=ho.top().l;
            ho.pop();
            continue;
        }
        if(rsum<m){
            rsum++;
            sum-=k;
            ho.pop();
            continue;
        }
        sum-=k;
        ho.pop();
    }
    if(sum>=0&&lsum==rsum){
        return 1;
    }
    else if(lsum==rsum){
        return 4;
    }
    else if(lsum>rsum)return 2;
    else{
        return 3; 
    }
}


int main(){
    scanf("%lld",&t);
    while(t--){
        scanf("%lld%lld",&n,&s);
        for(int i=1;i<=n;i++){
            scanf("%lld%lld",&l[i],&r[i]);
        }
        long long int rr=2000000000000000000,ll=1,ans=(rr+ll)/2;
        while(ll!=ans){
            int look=find(ans,s);
            if(look==1){
                ansm=ans;
                ll=ans;
                ans=(ll+rr)/2;
            }
            else if(look==2){
                rr=ans;
                ans=(ll+rr)/2;
            }
            else if(look==3){
                ll=ans;
                ans=(ll+rr)/2;
            }
            else{
                rr=ans;
                ans=(ll+rr)/2;
            }
        }
        printf("%lld\n",ansm);
    }
    return 0;
}
### Hive 拉链表加工逻辑及分区字段设计 #### 1. 拉链表的加工逻辑 拉链表是一种用于管理缓慢变化维度(Slowly Changing Dimension, SCD)的技术,广泛应用于数据仓库建设中。它的核心思想是通过引入两个时间字段 `h_start_dt` 和 `h_end_dt` 来标记每条记录的有效时间段[^5]。以下是拉链表的主要加工逻辑: - **初始化阶段** 初始加载时,将源表中的所有记录导入到目标拉链表中,并设置初始有效时间为当前日期或固定起始日期,结束时间为无穷远未来(通常设为 `2999-12-31` 或类似的极大值)。例如: ```sql INSERT INTO target_table (id, name, value, h_start_dt, h_end_dt) SELECT id, name, value, '2024-01-01', '2999-12-31' FROM source_table; ``` - **每日增量更新** 对于每天新增或变更的数据,需执行以下操作: - 找出需要关闭的历史记录(即存在更新的记录),将其 `h_end_dt` 更新为当前日期前一天。 - 插入新版本的记录,设置其 `h_start_dt` 为当前日期,`h_end_dt` 仍为未来的极大值。 示例代码如下: ```sql -- 关闭旧记录 UPDATE target_table SET h_end_dt = DATE_SUB(CURRENT_DATE, 1) WHERE id IN ( SELECT DISTINCT id FROM delta_table ) AND h_end_dt = '2999-12-31'; -- 插入新记录 INSERT INTO target_table (id, name, value, h_start_dt, h_end_dt) SELECT id, name, value, CURRENT_DATE, '2999-12-31' FROM delta_table; ``` - **历史查询支持** 用户可通过指定的时间范围来查询某一时刻的有效数据。例如,查询截至 `2024-03-06` 的员工信息可写成: ```sql SELECT * FROM target_table WHERE h_start_dt <= '2024-03-06' AND h_end_dt > '2024-03-06'; ``` --- #### 2. 拉链表与 Hive 分区字段的关系 在大规模数据场景下,为了优化查询性能,通常会对拉链表进行分区设计。常见的分区策略包括基于时间字段(如 `h_start_dt` 或 `h_update_dt`)或其他业务属性字段进行分区[^3]。 - **按 `h_start_dt` 分区** 将 `h_start_dt` 设为分区字段能够显著提高针对特定日期范围内数据的查询效率。例如: ```sql CREATE TABLE employee_lz ( id INT, name STRING, department STRING, salary DOUBLE, h_start_dt STRING, h_end_dt STRING ) PARTITIONED BY (h_start_dt STRING); ``` - **按 `h_update_dt` 分区** 若使用时间戳方式维护拉链表,则可以将 `h_update_dt` 设置为分区字段,便于快速定位最近更新的数据。例如: ```sql CREATE TABLE employee_lz_with_timestamp ( id INT, name STRING, department STRING, salary DOUBLE, h_update_dt TIMESTAMP, h_start_dt STRING, h_end_dt STRING ) PARTITIONED BY (h_update_dt_date STRING); -- 提取日期部分作为分区键 ``` 需要注意的是,分区字段的选择应综合考虑数据分布特点和查询模式。如果频繁涉及跨多个分区的查询,过多的分区可能导致性能下降;反之,过少的分区又无法充分利用 Hive 的并行计算能力[^5]。 --- #### 3. 实际应用场景举例 假设我们需要构建一张员工信息的拉链表,记录每位员工的职业生涯变迁情况。具体实现步骤如下: 1. **建表语句** 定义包含必要字段以及 `h_start_dt` 和 `h_end_dt` 时间标志的拉链表结构,并按照 `h_start_dt` 进行分区。 ```sql CREATE TABLE emp_career_history ( emp_id INT, position STRING, dept_name STRING, hire_date STRING, termination_date STRING, h_start_dt STRING, h_end_dt STRING ) PARTITIONED BY (h_start_dt STRING); ``` 2. **首次加载** 初始化拉链表,填充现有员工的基础信息。 ```sql INSERT INTO emp_career_history PARTITION(h_start_dt='2024-01-01') SELECT emp_id, position, dept_name, hire_date, NULL AS termination_date, '2024-01-01', '2999-12-31' FROM current_employee_data; ``` 3. **每日增量更新** 处理当天新增或调整岗位的员工数据,更新对应的拉链记录。 ```sql -- 关闭旧记录 UPDATE emp_career_history SET h_end_dt = DATE_SUB(CURRENT_DATE, 1) WHERE emp_id IN ( SELECT DISTINCT emp_id FROM daily_changes ) AND h_end_dt = '2999-12-31'; -- 插入新记录 INSERT INTO emp_career_history PARTITION(h_start_dt=CURRENT_DATE) SELECT emp_id, position, dept_name, hire_date, termination_date, CURRENT_DATE, '2999-12-31' FROM daily_changes; ``` 4. **历史数据查询** 支持任意时间点上的员工状态检索。 ```sql SELECT * FROM emp_career_history WHERE h_start_dt <= '2024-03-06' AND h_end_dt > '2024-03-06'; ``` --- ### 结论 通过对拉链表的核心概念、加工逻辑以及与 Hive 分区字段关系的探讨可知,合理利用时间和业务特性进行分区设计,能够在保障数据完整性的同时大幅提升查询效率。这不仅适用于员工职业生涯追踪这样的典型场景,还可推广至更多领域内的 SC D需求处理之中[^4]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值