PAT 1089. Insert or Merge

本文介绍了一个有趣的问题:如何判断两个数列是从插入排序过渡到另一个数列还是通过归并排序实现的。文章提供了具体的代码实现,并讨论了判断过程中的特殊情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

挺不错的题目。输入两个数列a和b,叫你判断从a到b是经过了插入排序呢,还是归并排序。
其实插入排序是很好判断的,只要找到前n个有序数,然后判断后面的数是不是一动不动就可以了。为了达到熟悉插入排序的目的
归并的话就是只能是一步步递归下来如果中间有和目标数组一样的话就跳出来。
其实题目中说的是答案是唯一的,但是牛客网的案例会有就是插入排序的到了某个数一动不动的,比如

10
3 1 2 8 7 5 9 4 6 0
1 2 3 5 7 8 9 4 6 0

原来的代码到第6个元素8就跳出来认为是插入排序了,但是答案输出却是认为到了第7个元素9才是。导致出现了多解的情况,所以为了过样例加了个限制条件if(isSame(a,b) == 1&&a[i]<a[i-1]),但其实意思不大。

#include <iostream>
#include <stdio.h>
#include <cstring>
#include <cstdio>
#include <map>
#include <math.h>
#include <string.h>
#include <algorithm>
#include <vector>
#include <queue>
using namespace std;

const int maxn = 111;
int n;

int isSame(int a[], int b[])
{
    for(int i = 0;i < n;i++)
        if(a[i]!=b[i])
            return 0;
    return 1;
}

void show(int a[])
{
    for(int i = 0; i<n ; i++)
    {
        if(i==0)
            printf("%d",a[i]);
        else
            printf(" %d",a[i]);
    }

    return;
}

int insertsort(int a[],int b[])
{
    int flag = 0;
    int j,tmp;
    for(int i = 1;i<n;i++)
    {
        if(isSame(a,b) == 1&&a[i]<a[i-1])
            flag = 1;
        j=i;
        tmp = a[i];
        /************************************************************/
        /*一个循环搞定插入排序,边找边移,找到了比目标小的元素就直接替换*/
        while(j>0&&a[j-1]>tmp)
        {
            a[j]=a[j-1];
            j--;
        }
        a[j]=tmp;
        /************************************************************/
        if(flag == 1)
        {
            printf("Insertion Sort\n");
            //printf("%d %d\n",j,tmp);
            show(a);
            return 1;
        }
    }
    return 0;
}

void mergesort(int a[],int b[])
{
    int flag = 0;
    for(int step = 2;step/2 <= n;step *= 2)
    {
        if(isSame(a,b) == 1)
            flag = 1;
        for(int i = 0;i<n;i+=step)
            sort(a+i, a+min(i+step, n));
        if(flag == 1)
        {
            printf("Merge Sort\n");
            show(a);
            return;
        }
    }

}

int main()
{
    int i,j,k,m;
    int a[maxn],b[maxn],c[maxn];
    scanf("%d", &n);

    for(i=0;i<n;i++)
    {
        scanf("%d", &a[i]);
        b[i] = a[i];
    }
  for(i=0;i<n;i++)
        scanf("%d",&c[i]);

    j = insertsort(a,c);
    if(j==1)
        return 0;
    else
        mergesort(b,c);


    return 0;
}
/*
10
3 1 2 8 7 5 9 4 6 0
1 2 3 7 8 5 9 4 6 0
10
3 1 2 8 7 5 9 4 6 0
1 2 3 5 7 8 9 4 6 0
*/

然后再好好复习下归并排序的递归写法和非递归写法。

递归

void merge(int a[], int l1, int r1, int l2, int r2)
{
    int i,j,index;
    i = l1;j = l2;index = 0;
    int tmp[maxn];
    while(i<=r1&&j<=r2)
    {
        if(a[i]<a[j])
            tmp[index++] = a[i++];
        else
            tmp[index++] = a[j++];
    }
    while(i<=r1) tmp[index++] = a[i++];
    while(j<=r2) tmp[index++] = a[j++];

    for(i=0;i<index;i++)
        a[l1+i]=tmp[i];
}

void mergesort(int a[],int left,int right)
{
    if(left>=right)
        return;
    int mid = (left+right)/2;
    mergesort(a,left, mid);
    mergesort(a,mid+1,right);
    merge(a,left,mid,mid+1,right);
}

非递归

void mergesort(int a[])
{
    for(int step = 2;step/2 <= n;step *= 2)
    {
        for(int i = 0;i<n;i+=step)
        {
            int mid = i + step / 2 - 1;
            if(mid + 1 <= n)
                merge(a, i, mid, mid+1, min(i+step-1,n));
        }
    }
}

了解即可。算法笔记上给出了一种更简单的用sort的。

<think>我们正在讨论如何配置StarRocks Sink的`merge_condition`参数。该参数用于在写入时实现条件更新(Conditional Update),即只有满足特定条件的记录才会被更新。 ### 背景知识 - **`merge_condition`参数**:在StarRocks的Sink连接器中,该参数允许用户指定一个条件,只有当该条件满足时,新的记录才会覆盖旧的记录。这在需要实现特定更新策略(如仅当新记录的时间戳更大时才更新)时非常有用。 ### 配置步骤 #### 1. **确认StarRocks表支持条件更新** - 目标表必须是Primary Key模型(因为只有主键模型支持更新) - 主键必须定义正确 #### 2. **在Flink SQL中配置Sink表时设置`merge_condition`参数** 在创建Sink表的`WITH`参数中,添加`sink.properties.merge_condition`属性,值为条件表达式(字符串形式)。该表达式会直接传递给StarRocks的Stream Load,并在StarRocks内部执行。 示例: ```sql CREATE TABLE sink_orders ( order_id BIGINT, user_id BIGINT, amount DECIMAL(10,2), update_time TIMESTAMP(3), PRIMARY KEY (order_id) NOT ENFORCED ) WITH ( 'connector' = 'starrocks', 'jdbc-url' = 'jdbc:mysql://fe_host:9030', 'load-url' = 'fe_host:8030', 'database-name' = 'your_db', 'table-name' = 'orders', 'username' = 'root', 'password' = '', 'sink.properties.format' = 'JSON', 'sink.properties.strip_outer_array' = 'true', -- 设置merge_condition参数:仅当新记录的update_time大于原记录的update_time时才更新 'sink.properties.merge_condition' = 'update_time > source.update_time' ); ``` **注意**: - 条件表达式中的字段名使用**目标表**的字段名。 - `source.update_time`表示目标表中已存在记录的`update_time`值(即旧值),而直接写`update_time`表示新记录的`update_time`值(即流中的数据)。 - 实际上,在StarRocks的Stream Load中,条件表达式中的新记录字段直接写字段名,旧记录字段用`source.字段名`表示。但请注意,在Flink的配置中,我们只需要按照StarRocks的语法写即可。 #### 3. **验证条件更新** 写入数据后,可以查询StarRocks表,检查更新是否符合条件。 ### 注意事项 1. **条件表达式语法**: - 表达式必须返回布尔值(`true`或`false`)。 - 支持比较操作(`>`, `<`, `>=`, `<=`, `=`, `!=`)和逻辑操作(`AND`, `OR`, `NOT`)。 - 例如:`'sink.properties.merge_condition' = 'amount > source.amount'`(当新记录的金额大于旧金额时更新) 2. **字段存在性**: - 条件表达式中引用的字段必须在目标表中存在,且类型匹配。 3. **性能影响**: - 条件更新会增加StarRocks的处理开销,因为需要比较新旧记录。请确保条件表达式尽可能简单。 4. **与Flink版本兼容性**: - 确保使用的Flink连接器版本支持`merge_condition`参数(建议使用较新版本,如1.2.7以上)。 5. **错误处理**: - 如果条件表达式有语法错误,Stream Load会失败,Flink作业会收到错误信息。 ### 示例场景 **需求**:只更新最近更新的订单金额。 - 数据流中订单记录包含`order_id`(主键)和`amount`(金额)以及`update_time`(更新时间戳)。 - 希望只有当新记录的`update_time`大于目标表中该订单的`update_time`时才更新。 **Sink配置**: ```sql 'sink.properties.merge_condition' = 'update_time > source.update_time' ``` ### 常见问题 1. **条件表达式不起作用?** - 检查表达式语法是否正确(包括字段名拼写)。 - 确保目标表是Primary Key模型。 2. **如何实现仅更新部分字段?** - 条件更新本身不限制更新的字段,但可以通过条件控制是否执行更新。所有字段的更新是原子性的。 3. **能否在Flink SQL的INSERT语句中添加条件?** - 不能。条件更新是在StarRocks内部完成的,因此必须在Sink配置中指定。 ### 相关配置优化 - 调整批量写入参数以平衡吞吐量和延迟: ```sql 'sink.buffer-flush.max-rows' = '50000', -- 默认30000 'sink.buffer-flush.interval-ms' = '10000' -- 默认3000毫秒 ``` ### 总结 通过配置`merge_condition`参数,可以实现基于条件的更新,从而更灵活地控制数据写入行为。这对于需要处理缓慢变化维(SCD)或避免旧数据覆盖新数据的场景尤其有用。 --- §§相关问题§§ 1. 如何配置StarRocks Sink实现幂等写入? 2. StarRocks Sink支持哪些数据格式? 3. 如何在StarRocks中处理数据更新冲突?</think>### 配置 StarRocks Sink 的 `merge_condition` 参数指南 在 Flink SQL 写入 StarRocks 时,`merge_condition` 参数用于实现**条件更新**(Conditional Update),即仅当满足特定条件时才执行更新操作。以下是详细配置方法和技术要点: --- #### 1. **基本配置语法** 在 Flink SQL 的 Sink 表定义中,通过 `sink.properties.merge_condition` 参数指定条件表达式: ```sql CREATE TABLE starrocks_sink ( id BIGINT, name STRING, version INT, update_time TIMESTAMP(3) ) WITH ( 'connector' = 'starrocks', 'jdbc-url' = 'jdbc:mysql://fe_host:9030', 'load-url' = 'fe_host:8030', 'database-name' = 'db', 'table-name' = 'table_name', 'username' = 'user', 'password' = 'pass', -- 关键配置:定义更新条件 'sink.properties.merge_condition' = 'version > source.version' ); ``` --- #### 2. **参数核心作用** - **实现条件更新**:仅当条件满足时,新数据才会覆盖旧数据(否则忽略更新) - **典型场景**: - 仅当新数据的版本号更大时更新(如上例) - 仅当新数据的时间戳更近时更新 - 避免旧数据覆盖新数据(防止回滚) --- #### 3. **技术要点解析** 1. **条件表达式语法**: - 使用 **`source.` 前缀引用目标表当前值** - 直接字段名引用写入数据的新值 ```sql 'sink.properties.merge_condition' = 'update_time > source.update_time' ``` 2. **目标表要求**: - 必须是 **Primary Key 模型表**(仅主键模型支持条件更新)[^1] - 主键需包含在条件字段中(如 `id`) 3. **数据类型匹配**: - 条件字段需在 Flink 和 StarRocks 中保持**相同数据类型** - 常见支持类型:数值类型、时间戳、字符串 --- #### 4. **完整示例场景** **需求**:仅当新数据的版本号大于当前版本时更新记录 **Flink SQL 配置**: ```sql INSERT INTO starrocks_sink SELECT id, name, version, -- 新版本号 update_time FROM source_table; -- Sink 表定义 WITH ( ... 'sink.properties.merge_condition' = 'version > source.version', 'sink.properties.format' = 'JSON' ); ``` **执行效果**: - 若目标表当前 `version=5`,写入数据 `version=6` → **执行更新** - 若目标表当前 `version=5`,写入数据 `version=3` → **忽略更新** --- #### 5. **注意事项** 1. **条件字段必须存在**: - 所有条件字段(如 `source.version`)必须在目标表中存在 2. **性能影响**: - 复杂条件可能降低写入吞吐量(需在 StarRocks 端逐行判断) - 建议条件表达式保持简单(如单字段比较) 3. **与更新策略配合**: - 若需保留旧数据,可组合使用 `sink.semantic = 'exactly-once'` [^1] - 批量参数优化: ```sql 'sink.buffer-flush.max-rows' = '100000', 'sink.buffer-flush.interval-ms' = '5000' ``` --- #### 6. **调试建议** 1. **验证条件表达式**: ```sql -- 在 StarRocks 中直接测试条件 SELECT * FROM table_name WHERE version > source.version; ``` 2. **监控写入日志**: - 在 Flink TaskManager 日志中搜索 `merge_condition` 确认参数生效 - 检查 StarRocks FE 日志 `/fe/log/fe.warn.log` 中的 Stream Load 记录 3. **常见错误处理**: - `Unknown column 'source.version'` → 检查字段名拼写 - `Conditional update not supported` → 确认表是 Primary Key 模型 > **提示**:该功能在 StarRocks 2.4+ 和 Flink Connector 1.2.7+ 中稳定支持[^1]。 ---
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值