最长公共子串(连续)/子序列(不连续)

本文详细解析了最长公共子串和最长公共子序列的算法原理及实现,通过动态规划解决两个序列的公共部分问题,适用于字符串比较与生物信息学等领域。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、题目描述

1、【最长公共子串】

计算两个字符串的最长公共子串的长度,字符不区分大小写

假设 X 和 Y 的序列如下:
X[1...m] = {a,s,d,f,a,s,r}
Y[1...n] = {w,e,r,a,s,d,f,a,s,w,e,r}
可以看出,X 和 Y 的最长公共子串为 “a,s,d,f,a,s”,即长度为6

2、【最长公共子序列】

给定两个序列:X[1...m]和Y[1...n],求在两个序列中同时出现的最长子序列的长度。

假设 X 和 Y 的序列如下:
X[1...m] = {A, B, C, B, D, A, B}
Y[1...n] = {B, D, C, A, B, A}
可以看出,X 和 Y 的最长公共子序列有 “BDAB”、“BCAB”、“BCBA”,即长度为4

二、解题思路

1、【最长公共子串】--连续

动态规划思想,设定dp[i][j]记录子串X[1,,i]和子串Y[1,,j]的公共子串长度,则
dp[i][j] = dp[i-1][j-1]+1   ->   X[i]==Y[j]
dp[i][j] = 0

2、【最长公共子序列】--不连续

采用动态规划的思想,设dp[i][j]为序列X[1...i]和序列Y[1...j]的最长公共子序列长度,则
dp[i][j] = dp[i-1][j-1]+1                     ->        X[i]==Y[j]
dp[i][j] = max(dp[i-1][j],dp[i][j-1])     ->        X[i]!=Y[j]

三、解题算法

1、【最长公共子串】--连续

/**********************************
author:tmw
date:2018-10-22
**********************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define max(a,b) (a>b?a:b)

int findLongestSubStr(char* X, char* Y, int X_len, int Y_len)
{
    int dp[X_len+1][Y_len+1];
    int i,j;
    int max_continue_len = 0;
    for(i=0; i<=X_len; i++)
        dp[i][0] = 0;
    for(j=0; j<=Y_len; j++)
        dp[0][j] = 0;

    for(i=1; i<=X_len; i++)
    {
        for(j=1; j<=Y_len; j++)
        {
            if(X[i] == Y[j])
            {
                dp[i][j] = dp[i-1][j-1]+1;
                max_continue_len = max(max_continue_len,dp[i][j]);
            }
            else
                dp[i][j] = 0;
        }
    }
    return max_continue_len;
}

2、【最长公共子序列】--不连续

/**********************************
author:tmw
date:2018-10-22
**********************************/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

#define max(a,b) (a>b?a:b)

int findLongestCommonSubSequence(char* X, char* Y, int X_len, int Y_len)
{
    int dp[X_len+1][Y_len+1];
    int i,j;
    for(i=0; i<X_len; i++)
        for(j=0; j<Y_len; j++)
            dp[i][j] = 0;

    for(i=1; i<=X_len; i++)
    {
        for(j=1; j<=Y_len; j++)
        {
            if(X[i] == Y[j])
                dp[i][j] = dp[i-1][j-1]+1;
            else
                dp[i][j] = max(dp[i-1][j],dp[i][j-1]);
        }
    }
    return dp[X_len][Y_len];
}

 

梦想还是要有的,万一实现了呢~~~~ヾ(◍°∇°◍)ノ゙~~~~~~~~~

### C++ 实现最长公共子串最长公共子序列的暴力算法 #### 最长公共子串的暴力求解方法 以下是基于暴力枚举的方法来寻找两个字符串之间的最长公共子串: ```cpp #include <iostream> #include <vector> #include <string> using namespace std; void findLongestCommonSubstring(const string& s1, const string& s2) { int maxLength = 0; string result = ""; for (int i = 0; i < s1.length(); ++i) { for (int j = 0; j < s2.length(); ++j) { int k = 0; while ((i + k) < s1.length() && (j + k) < s2.length() && s1[i + k] == s2[j + k]) { k++; } if (k > maxLength) { maxLength = k; result = s1.substr(i, k); } } } cout << "最长公共子串为:" << result << endl; } int main() { string str1 = "cnblogs"; string str2 = "belong"; findLongestCommonSubstring(str1, str2); return 0; } ``` 此代码通过双重循环遍历 `s1` 和 `s2` 的每一个位置,尝试匹配从当前位置开始的最大相同部分[^2]。 --- #### 最长公共子序列的暴力求解方法 对于最长公共子序列问题,可以使用递归来穷尽所有可能性并找到最优解。以下是一个简单的暴力实现方式: ```cpp #include <iostream> #include <string> using namespace std; // 辅助函数用于计算LCS长度 int lcsLength(string X, string Y, int m, int n) { if (m == 0 || n == 0) return 0; if (X[m - 1] == Y[n - 1]) return 1 + lcsLength(X, Y, m - 1, n - 1); else return max(lcsLength(X, Y, m, n - 1), lcsLength(X, Y, m - 1, n)); } // 主程序入口 int main() { string str1 = "cnblogs"; string str2 = "belong"; int length = lcsLength(str1, str2, str1.length(), str2.length()); cout << "最长公共子序列的长度为:" << length << endl; return 0; } ``` 该代码的核心在于递归地判断当前字符是否相等,并分别处理三种情况:继续向前探索、跳过第一个字符串中的字符或者跳过第二个字符串中的字符[^1]。 --- ### 结果分析 - **最长公共子串**的结果依赖于连续性条件,在上述例子中会输出 `"lo"`。 - **最长公共子序列**则需要考虑连续性,因此其结果可能是 `"blog"` 或其他符合条件的组合[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值