718.Maximum Length of Repeated Subarray(M)

本文通过对比暴力求解和动态规划两种方法,介绍了如何解决两个数组间的最长重复子集问题。通过对原始暴力方法的分析,指出其存在的重复计算问题,并提出使用动态规划来优化效率。

题目描述

给定两个数组A,B,要求两个数组中最长重复的子集,原题以及例子如下,
这里写图片描述
看到题目表述后,很容易想到一种方法,暴力求解,下面附上我暴力求解的代码

int findLength(vector<int>& A, vector<int>& B) {
        int max = 0;
        int count = 0;
        int j = 0;
        int lengthA = A.size();
        int lengthB = B.size();
        for (int i = 0; i < lengthA; ++i) {
            count = 0;
            j = 0;
            if (lengthA - i <= max) break;
            while (j != lengthB) {
                if (i + count < lengthA && j + count < lengthB && A[i + count] == B[j + count]) {
                    ++count;
                } else {
                    if (max < count) {
                        max = count;
                    }
                    count = 0;
                    ++j;
                }
            }
        }
        return max;
    }

写完后,细心的同学能发现,这里是有很多重复的子问题的。那么,如果有重复的子问题我们应该用什么方法消除重复的计算呢?很明显,是动态规划。
首先,我们确定重复计算出现的地方。在这道题里是很明显的,在里层的while循环里做了很多不必要的循环。即,当匹配到某个数字相同时,会从当前位置继续比较A的下一个字符串,但其实这个动作在下一次循环中会重复。
然后,想一想怎么在空间和时间上作一个权衡,即减少重复计算,把之前的计算存储起来。在这道题里,我们可以发现,当A[i] = B[i]时,我们原本是对count做一个加法运算,我们在此时可以把count存储起来,那么之后就没必要继续进行重复的计算,让A[i]的下一个字母与B[i]的下一个字母继续比较,可以在下一次的循环中直接查询。之后再进行计算时,直接索引到这个位置然后加一就好。
下面是我动态规划代码的实现,

int findL(vector<int>& A, vector<int>& B) {
        int max = 0;
        int la = A.size();
        int lb = B.size();
        vector<vector<int> > dp( la + 1, vector<int>( lb + 1, 0 ) );

        for (int i = 1; i <= la; ++i) {
            for (int j = 1; j <= lb; ++j) {
                if (A[i - 1] == B[j - 1]) {
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                    max = dp[i][j] > max ? dp[i][j] : max;
                }
            }
        }
        return max;

    }
在Stata中遇到 `. xtset id year` 报错 `repeated time values within panel r(451)` 的情况时,说明数据集存在某些问题。具体来说,在面板数据中设置了相同的“时间”值,这违反了面板数据分析的要求——每个个体(id)的时间点应该是唯一的。 ### 解释报错原因及解决办法 #### 原因分析 当运行命令 `. xtset id year` 时报错 `repeated time values within panel` ,表示在同一组内(即同一个 `id` 下),可能存在重复的年份记录。例如: | id | year | |----|------| | 1 | 2000 | | 1 | 2000 | (重复) | 1 | 2001 | 这种情况下,Stata无法将该数据识别为标准的面板数据结构。 --- #### 检查并解决问题 以下是几种常见的检查和修复方法: 1. **查看是否有重复观察值** 使用以下命令检查是否存在完全一致的行(包括所有变量都相等的情况): ```stata duplicates report ``` 如果发现有重复观测值,则可以考虑删除它们: ```stata duplicates drop ``` 2. **仅针对特定列查找重复项** 可能您只需要关注是否在某个范围内出现了重复年份而不关心其他信息。这时可以用下面这个指令找到那些存在问题的数据条目: ```stata bysort id (year): gen dup = cond(_N == 1, 0, _n) list if dup >1 ``` 3. **处理非唯一标识符的问题** 确认每一条记录都有独一无二的身份组合(比如通过增加额外字段作为补充区分依据)。如果确实需要保留看似重复但实际上代表不同事件的信息,则应该调整主键定义以避免冲突发生。 --- #### 示例操作流程 假设我们有一份包含用户购买历史的商品销售表,并且想把它当作面板数据研究消费习惯变化趋势,但是系统提示上述错误怎么办? ```plaintext +------+-------+ | user | month | +------+-------+ | A | Jan | | A | Feb | | B | Mar | | C | Apr | | C | Apr | // Duplicate entry for same period. +------+-------+ ``` 此时应先定位到具体的双重录入位置再做相应修正动作。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值