1140. Look-and-say Sequence

本文介绍了一种基于描述连续数字个数的“看说”序列生成算法,并提供了一个具体的实现案例。通过输入初始数字和目标序列编号,可以计算并输出指定编号的序列。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Look-and-say Sequence

Look-and-say sequence is a sequence of integers as the following:

D, D1, D111, D113, D11231, D112213111, …
where D is in [0, 9] except 1. The (n+1)st number is a kind of description of the nth number. For example, the 2nd number means that there is one D in the 1st number, and hence it is D1; the 2nd number consists of one D (corresponding to D1) and one 1 (corresponding to 11), therefore the 3rd number is D111; or since the 4th number is D113, it consists of one D, two 1’s, and one 3, so the next number must be D11231. This definition works for D = 1 as well. Now you are supposed to calculate the Nth number in a look-and-say sequence of a given digit D.

Input Specification:

Each input file contains one test case, which gives D (in [0, 9]) and a positive integer N (<=40), separated by a space.

Output Specification:

Print in a line the Nth number in a look-and-say sequence of D.

Sample Input:

1 8

Sample Output:

1123123111

题意

给定一个初始数字d和目标序列编号n,要求输出第n个序列。

序列的生成规则是,后一个序列是对前一个序列中连续数字个数的描述。以 d = 1 为例:

  • 序列①:1,即为d本身;
  • 序列②:11,表明①中有1个1;
  • 序列③:12,表明②中有2个1;
  • 序列④:1121,表明③中有1个1、1个2;
  • 序列⑤:122111,表明④中有2个1、1个2、1个1;
  • ……

思路

直接按照题意进行模拟即可,详见代码。


代码实现

#include <iostream>
#include <string>
#include <vector>
using namespace std;

void nextString(string &s)      // 生成下一个序列
{
    vector<char> temp;          // 存储当前序列各个数字及其个数

    int x = s[0] - '0';         // 当前数字
    int cnt = 0;                // 当前数字个数
    for (int i = 0; i < s.length(); i++)
    {
        if (s[i] - '0' == x)
            cnt++;
        else            // 旧数字连续序列结束
        {
            temp.push_back(x);
            temp.push_back(cnt);
            x = s[i] - '0';     // 更新当前数字
            cnt = 1;
        }
    }
    temp.push_back(x);      // 将当前序列最后一个数字及其个数存入temp
    temp.push_back(cnt);

    s.clear();      // 清空当前序列
    for (int i = 0; i < temp.size(); i++)
        s += temp[i] + '0';
}

int main()
{
    string d;
    int n;

    cin >> d >> n;

    for (int i = 0; i < n - 1; i++)     // 只要执行 n - 1 次
        nextString(d);

    cout << d;

    return 0;
}
<think>我们正在讨论Flink Paimon中的聚合表(Aggregation Table)及其配置参数。用户特别询问了`aggregation.remove-record-on-sequence-group`参数的作用和使用场景。 根据Paimon的文档,聚合表是一种特殊的主键表,它通过预聚合来加速查询。在聚合表中,我们定义聚合函数(如sum、count、min、max等)来在数据写入时进行预计算。 在聚合表中,由于数据可能以乱序到达(尤其是在流处理场景中),我们需要一种机制来处理乱序数据并确保最终聚合结果的正确性。这就是`sequence-group`和`remove-record-on-sequence-group`参数发挥作用的地方。 ### 参数详解 1. **`sequence-group`**:该配置用于指定一个字段作为序列字段(通常是一个时间戳字段),以确定数据到达的顺序。在同一个分组(由主键确定)内,Paimon会根据这个序列字段的值来决定数据的先后顺序。当有新的数据到达时,如果它的序列字段值比当前已存储的数据的序列字段值更小(即更早的数据),那么它将被视为乱序数据。 2. **`aggregation.remove-record-on-sequence-group`**:这是一个布尔类型的配置参数(默认为false)。当设置为true时,它的作用是:对于乱序到达的数据(即其序列字段值小于当前已存储的同一主键分组的序列字段值),Paimon会直接丢弃这条数据,而不是将其与现有记录进行合并。 ### 使用场景 - **场景一(默认行为,即该参数为false)**:当乱序数据到达时,Paimon会尝试将其与当前存储的数据进行合并(根据定义的聚合函数)。这可能会导致存储的数据被更新(例如,对于sum聚合,旧数据会加到当前值上)。但是,这可能会带来一个问题:如果乱序数据代表的是一个已经被更新过的旧值,那么再次合并可能会导致重复计算,从而得到错误的结果。 - **场景二(该参数设置为true)**:直接丢弃乱序数据。这种策略适用于那些可以容忍丢失部分乱序数据的场景,尤其是当乱序数据已经过时且不再重要时。例如,在实时监控系统中,我们可能只关心最新的数据,而旧的数据即使到达也可以丢弃。这样可以避免重复计算,同时也可以减少存储和计算开销。 ### 配置示例 在创建Paimon表时,可以在WITH参数中设置该配置。例如: ```sql CREATE TABLE T ( user_id BIGINT, product_id BIGINT, quantity BIGINT, update_time TIMESTAMP(3), PRIMARY KEY (user_id, product_id) NOT ENFORCED ) WITH ( 'changelog-producer' = 'input', 'merge-engine' = 'aggregation', 'fields.quantity.aggregate-function' = 'sum', 'fields.update_time.aggregate-function' = 'max', 'fields.update_time.sequence-group' = 'update_time', 'aggregation.remove-record-on-sequence-group' = 'true' ); ``` 在这个例子中: - 我们定义了一个聚合表,主键是`(user_id, product_id)`。 - `quantity`字段使用sum聚合,`update_time`字段使用max聚合。 - 我们指定`update_time`作为序列字段(通过`fields.update_time.sequence-group`配置)。 - 设置`aggregation.remove-record-on-sequence-group`为true,表示当有乱序数据(即其update_time小于当前存储的同一主键的update_time)到达时,直接丢弃该条记录。 ### 注意事项 - 该参数仅在聚合表(`merge-engine`为`aggregation`)中有效。 - 使用该参数需要谨慎,因为丢弃数据可能会导致结果不准确。因此,它适用于那些对数据准确性要求不是绝对严格,且更注重实时性和性能的场景。 - 在设置该参数为true时,建议确保数据源能够提供相对有序的数据(例如通过Flink的watermark机制处理乱序),以减少乱序数据的发生。 ### 总结 `aggregation.remove-record-on-sequence-group`参数用于控制聚合表对乱序数据的处理方式。当设置为true时,乱序数据会被直接丢弃,从而避免重复计算和减少存储开销,但可能会丢失部分数据。用户应根据业务场景对数据准确性和实时性的要求来决定是否启用此配置。 §§相关问题§§ 1. Paimon聚合表中还有哪些其他重要的配置参数? 2. 如何处理聚合表中的数据乱序问题?除了丢弃乱序数据,还有哪些方法? 3. 在Paimon聚合表中,如何确保聚合结果的准确性和一致性?</think>### Flink Paimon `aggregation.remove-record-on-sequence-group` 参数详解 在 Apache Paimon 的聚合引擎中,`aggregation.remove-record-on-sequence-group` 是一个关键配置参数,主要用于优化**乱序数据处理**和**聚合结果准确性**。以下是详细解析: --- #### 一、参数作用 1. **核心功能** - 当数据因网络延迟等原因**乱序到达**时,该参数决定是否**丢弃旧序列号的数据**。 - 若启用(`true`),Paimon 会主动丢弃序列号(如时间戳)小于当前存储值的记录,避免无效计算。 - 若禁用(`false`,默认值),所有记录都会被保留并参与聚合,可能导致结果冗余或错误。 2. **适用场景** - **流式聚合场景**:处理 CDC 数据流时,乱序数据频繁出现(如数据库 binlog 延迟)。 - **高吞吐低延迟需求**:通过丢弃旧数据减少计算量,提升处理效率。 - **结果精确性要求**:避免因乱序数据导致聚合值被反复覆盖(如最大值/最小值)。 --- #### 二、参数配置示例 在创建 Paimon 表时配置参数: ```sql CREATE TABLE orders ( order_id STRING, product_id STRING, amount DECIMAL(10,2), update_time TIMESTAMP(3), WATERMARK FOR update_time AS update_time - INTERVAL '5' SECOND, PRIMARY KEY (order_id) NOT ENFORCED ) WITH ( 'merge-engine' = 'aggregation', -- 启用聚合引擎 'fields.amount.aggregate-function' = 'sum', -- 定义聚合函数 'fields.update_time.aggregate-function' = 'max', -- 序列字段用 max 聚合 'fields.update_time.sequence-group' = 'update_time', -- 指定序列字段 'aggregation.remove-record-on-sequence-group' = 'true' -- 启用乱序数据丢弃 ); ``` --- #### 三、工作机制 假设数据按时间顺序处理: 1. **初始状态** - 存储记录:`(order_001, $100, update_time=1000)` 2. **乱序数据到达** - 新记录:`(order_001, $50, update_time=900)`(时间戳更小) 3. **参数行为**: - `remove-record-on-sequence-group=true` → 直接丢弃该记录(因 `900 < 1000`)。 - `remove-record-on-sequence-group=false` → 保留并聚合,导致 `sum($100+$50)=$150`(可能错误)。 --- #### 四、使用场景建议 1. **推荐启用的情况** - 业务容忍**少量数据丢失**(如监控指标、实时大盘)。 - 数据延迟较高且乱序频繁,需**优化吞吐性能**。 - 序列字段严格递增(如 Kafka offset、数据库事务 ID)。 2. **不推荐启用的情况** - 需 100% 数据精确性的场景(如金融对账)。 - 序列字段非单调递增(如人工修正的时间戳)。 --- #### 五、与其他配置的协同 1. **依赖 `sequence-group`** - 需通过 `fields.{field}.sequence-group` 指定序列字段(如时间戳、版本号)。 2. **异步 Compaction 优化** 若开启异步 Compaction 避免写阻塞,可配合: ```sql 'num-sorted-run.stop-trigger' = '2147483647', 'sort-spill-threshold' = '10' ``` 3. **Changelog 生成** 需正确配置 `changelog-producer`(如 `'input'` 或 `'lookup'`)确保下游消费正确变更数据[^1]。 --- ### 总结 | **配置项** | **值类型** | **默认值** | **核心影响** | |----------------------------------------|------------|------------|----------------------------------| | `aggregation.remove-record-on-sequence-group` | Boolean | `false` | 丢弃旧序列号数据以优化聚合性能 | 通过该参数,Paimon 在流式聚合场景下平衡了**准确性**与**性能**,特别适合 CDC 同步、实时数仓等场景[^1][^2]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值