题目## 题目
题目主要信息:
- 查找两个字符串str1,str2中的最长的公共子串
- 保证str1和str2的最长公共子串存在且唯一
举一反三:
学习完本题的思路你可以解决如下题目:
方法一:枚举(前置方法,超时,不能完全通过)
思路:
最简单直观的方式大概就是枚举了,枚举所有的子串进行比较,但是太复杂了。其实找子串不用一样完全枚举,还可以尝试改良一下
具体做法:
- step 1:我们完全可以遍历两个字符串的所有字符串作为起始
- step 2:然后同时开始检查字符是否相等,相等则不断后移,增加子串长度,如果不等说明以这两个为起点的子串截止了,不会再有了。
- step 3:后续比较长度维护最大值即可。
图示:
Java实现代码:
import java.util.*;
public class Solution {
public String LCS (String str1, String str2) {
int length = 0;
String res = "";
//遍历s1每个起始点
for(int i = 0; i < str1.length(); i++){
//遍历s2每个起点
for(int j = 0; j < str2.length(); j++){
int temp = 0;
String temps = "";
int x = i, y = j;
//比较每个起点为始的子串
while(x < str1.length() && y < str2.length() && str1.charAt(x) == str2.charAt(y)){
temps += str1.charAt(x);
x++;
y++;
temp++;
}
//更新更大的长度子串
if(length < temp){
length = temp;
res = temps;
}
}
}
return res;
}
}
C++实现代码:
class Solution {
public:
string LCS(string str1, string str2) {
int length = 0;
string res = "";
//遍历s1每个起始点
for(int i = 0; i < str1.length(); i++){
//遍历s2每个起点
for(int j = 0; j < str2.length(); j++){
int temp = 0;
string temps = "";
int x = i, y = j;
//比较每个起点为始的子串
while(x < str1.length() && y < str2.length() && str1[x] == str2[y]){
temps += str1[x];
x++;
y++;
temp++;
}
//更新更大的长度子串
if(length < temp){
length = temp;
res = temps;
}
}
}
return res;
}
};
Python代码实现:(Python版本不超时)
class Solution:
def LCS(self , str1: str, str2: str) -> str:
#让str1为较长的字符串
if len(str1) < len(str2):
str1, str2 = str2, str1
res = ''
max_len = 0
#遍历str1的长度
for i in range(len(str1)):
#查找是否存在
if str1[i - max_len : i + 1] in str2:
res = str1[i - max_len : i + 1]
max_len += 1
return res
复杂度分析:
- 时间复杂度: O ( m 2 n ) O(m^2n) O(m2n),其中 m m m是str1的长度, n n n是str2的长度,分别枚举两个字符串每个字符作为起点,后续检查子串长度最坏需要花费 O ( m ) O(m) O(m)
- 空间复杂度: O ( n ) O(n) O(n),res属于返回必要空间,temps属于临时辅助空间,最坏情况下长度为 n n n
方法二:动态规划(推荐使用)
知识点:动态规划
动态规划算法的基本思想是:将待求解的问题分解成若干个相互联系的子问题,先求解子问题,然后从这些子问题的解得到原问题的解;对于重复出现的子问题,只在第一次遇到的时候对它进行求解,并把答案保存起来,让以后再次遇到时直接引用答案,不必重新求解。动态规划算法将问题的解决方案视为一系列决策的结果
思路:
动态规划继承自方法一,在枚举的基础上用动态规划来改进。
具体做法:
- step 1:我们可以用 d p [ i ] [ j ] dp[i][j] dp[i][j]表示在str1中以第 i i i个字符结尾在str2中以第 j j j个字符结尾时的公共子串长度,
- step 2:遍历两个字符串填充dp数组,转移方程为:如果遍历到的该位两个字符相等,则此时长度等于两个前一位长度+1, d p [ i ] [ j ] = d p [ i − 1 ] [ j − 1 ] + 1 dp[i][j] = dp[i - 1][j - 1] + 1 dp[i][j]=dp[i−1][j−1]+1,如果遍历到该位时两个字符不相等,则置为0,因为这是子串,必须连续相等,断开要重新开始。
- step 3:每次更新 d p [ i ] [ j ] dp[i][j] dp[i][j]后,我们维护最大值,并更新该子串结束位置。
- step 4:最后根据最大值结束位置即可截取出子串。
Java实现代码:
import java.util.*;
public class Solution {
public String LCS (String str1, String str2) {
//dp[i][j]表示到str1第i个个到str2第j个为止的公共子串长度
int[][] dp = new int[str1.length() + 1][str2.length() + 1];
int max = 0;
int pos = 0;
for(int i = 1; i <= str1.length(); i++){
for(int j = 1; j <= str2.length(); j++){
//如果该两位相同
if(str1.charAt(i - 1) == str2.charAt(j - 1))
//则增加长度
dp[i][j] = dp[i - 1][j - 1] + 1;
else
//该位置为0
dp[i][j] = 0;
//更新最大长度
if(dp[i][j] > max){
max = dp[i][j];
pos = i - 1;
}
}
}
return str1.substring(pos - max + 1, pos + 1);
}
}
C++实现代码:
class Solution {
public:
string LCS(string str1, string str2) {
//dp[i][j]表示到str1第i个个到str2第j个为止的公共子串长度
vector<vector<int> > dp(str1.length() + 1, vector<int>(str2.length() + 1, 0));
int max = 0;
int pos = 0;
for(int i = 1; i <= str1.length(); i++){
for(int j = 1; j <= str2.length(); j++){
//如果该两位相同
if(str1[i - 1] == str2[j - 1]){
//则增加长度
dp[i][j] = dp[i - 1][j - 1] + 1;
}
else{
//该位置为0
dp[i][j] = 0;
}
//更新最大长度
if(dp[i][j] > max){
max = dp[i][j];
pos = i - 1;
}
}
}
return str1.substr(pos - max + 1, max);
}
};
Python代码实现:(Python版本超时,不能完全通过)
class Solution:
def LCS(self , str1: str, str2: str) -> str:
#dp[i][j]表示到str1第i个个到str2第j个为止的公共子串长度
dp = [[0] * (len(str2) + 1) for i in range(len(str1) + 1)]
max = 0
pos = 0
for i in range(1, len(str1) + 1):
for j in range(1, len(str2) + 1):
#如果该两位相同
if str1[i - 1] == str2[j - 1]:
#则增加长度
dp[i][j] = dp[i - 1][j - 1] + 1
else:
#该位置为0
dp[i][j] = 0
#更新最大长度
if dp[i][j] > max:
max = dp[i][j]
pos = i - 1
return str1[pos - max + 1: pos + 1]
复杂度分析:
- 时间复杂度: O ( m n ) O(mn) O(mn),其中 m m m是str1的长度, n n n是str2的长度,遍历两个字符串所有字符
- 空间复杂度: O ( m n ) O(mn) O(mn),dp数组大小为 m ∗ n m*n m∗n
题目主要信息:
- 给定一个字符串数组,其中有n个字符串,求所有字符串的最长公共前缀
- 公共前缀是指所有字符串都共有的前面部分的子串,从第一个字符开始
举一反三:
学会了本题的思路,你将可以解决类似的字符串问题:
方法:遍历查找(推荐使用)
思路:
既然是公共前缀,那我们可以用一个字符串与其他字符串进行比较,从第一个字符开始,逐位比较,找到最长公共子串。
具体做法:
- step 1:处理数组为空的特殊情况。
- step 2:因为最长公共前缀的长度不会超过任何一个字符串的长度,因此我们逐位就以第一个字符串为标杆,遍历第一个字符串的所有位置,取出字符。
- step 3:遍历数组中后续字符串,依次比较其他字符串中相应位置是否为刚刚取出的字符,如果是,循环继续,继续查找,如果不是或者长度不足,说明从第i位开始不同,前面的都是公共前缀。
- step 4:如果遍历结束都相同,最长公共前缀最多为第一个字符串。
图示:
Java代码实现:
import java.util.*;
public class Solution {
public String longestCommonPrefix (String[] strs) {
int n = strs.length;
//空字符串数组
if(n == 0)
return "";
//遍历第一个字符串的长度
for(int i = 0; i < strs[0].length(); i++){
char temp = strs[0].charAt(i);
//遍历后续的字符串
for(int j = 1; j < n; j++)
//比较每个字符串该位置是否和第一个相同
if(i == strs[j].length() || strs[j].charAt(i) != temp)
//不相同则结束
return strs[0].substring(0, i);
}
//后续字符串有整个字一个字符串的前缀
return strs[0];
}
}
C++代码实现:
class Solution {
public:
string longestCommonPrefix(vector<string>& strs) {
int n = strs.size();
//空字符串数组
if(n == 0)
return "";
//遍历第一个字符串的长度
for(int i = 0; i < strs[0].length(); i++){
char temp = strs[0][i];
//遍历后续的字符串
for(int j = 1; j < n; j++)
//比较每个字符串该位置是否和第一个相同
if(i == strs[j].length() || strs[j][i] != temp)
//不相同则结束
return strs[0].substr(0, i);
}
//后续字符串有整个字一个字符串的前缀
return strs[0];
}
};
Python实现代码:
class Solution:
def longestCommonPrefix(self , strs: List[str]) -> str:
n = len(strs)
#空字符串数组
if n == 0:
return ""
#遍历第一个字符串的长度
for i in range(len(strs[0])):
temp = strs[0][i]
#遍历后续的字符串
for j in range(1,n):
#比较每个字符串该位置是否和第一个相同
if i == len(strs[j]) or strs[j][i] != temp:
#不相同则结束
return strs[0][0:i]
#后续字符串有整个字一个字符串的前缀
return strs[0]
复杂度分析:
- 时间复杂度: O ( m n ) O(mn) O(mn),其中 m m m为数组中最短的字符串的长度, n n n为字符串数组的长度,两层遍历循环
- 空间复杂度: O ( 1 ) O(1) O(1),常数级变量,没有使用额外的辅助空间