给定两个字符串,一个模式串,一个目标串,找出目标串中符合模式串格式的字串

本文介绍了一种模式匹配算法,用于在目标字符串中查找符合特定模式的所有子串。通过将模式串中的字符及其位置映射到数据结构中,实现高效匹配。
题目: 给定两个字符串,一个模式串,一个目标串,找出目标串中符合模式串格式的字串

举例:str = "aaababaa", format = "XXYXY", 输出:"aabab"

思路: 将模式串按字符分类,存储每个字符出现的位置,例如:position['X'] = {0, 1, 3}。判断目标串中当前的子串是否符合模式串的格式。若符合,输出;否则,目标串中的指针向后移动一位,继续检查。

分析:时间复杂度O(K*N),K是模式串的长度,N是目标串的长度


[cpp]  view plain copy
  1. #include <string>  
  2. #include <map>  
  3. #include <list>  
  4. #include <stdio.h>  
  5.   
  6. /* 
  7.  * 字符串的模式匹配,类似正则表达式 
  8.  * 两个字符串:目标串和模式串 
  9.  * 打印目标串中具有模式串的模式的所有字串 
  10.  *  
  11.  */  
  12. bool MatchCore(const std::string &,   
  13.                const std::map<char, std::list<size_t> > &,  
  14.                size_t);  
  15.   
  16. void StrMatch(const std::string & str,   
  17.               const std::string & format)  
  18. {  
  19.     size_t fsize = format.size();  
  20.     if (fsize == 0 || fsize > str.size()) return;  
  21.   
  22.     size_t start = 0;  
  23.   
  24.     std::map<char, std::list<size_t> > position;  
  25.     for (size_t i = 0; i < fsize; ++ i)  
  26.         position[format.at(i)].push_back(i);          
  27.   
  28.     while (start <= str.size() - fsize)  
  29.     {  
  30.         if (MatchCore(str, position, start))  
  31.             printf("%s\n", str.substr(start, fsize).c_str());  
  32.         ++ start;  
  33.     }  
  34. }  
  35.   
  36. bool MatchCore(const std::string & str,   
  37.                const std::map<char, std::list<size_t> > & position,   
  38.                size_t start)  
  39. {  
  40.     std::map<char, std::list<size_t> >::const_iterator miter = position.begin();  
  41.     for (; miter != position.end(); ++ miter)  
  42.     {  
  43.         std::list<size_t>::const_iterator liter = (miter->second).begin();  
  44.         size_t first = *liter + start;  
  45.         for (++ liter; liter != (miter->second).end(); ++ liter)  
  46.         {  
  47.             if (str.at(*liter + start) != str.at(first))  
  48.                 return false;  
  49.         }  
  50.     }  
  51.     return true;  
  52. }  


PS:华为,2013,校招,面试

话外音:当时是华为的一面,在简单自我介绍后开始做题写代码。当时,第一次在面试官面前写代码,不免有点谨慎,生怕写的太乱。想了一会,开始写,当写到一半的时候,面试官不让我写了,估计他认为我用的时间超过了他认为这道题本该用的时间。我给他讲了下思路,还想让他注意到我考虑了边界等情况,他看了下代码,然后,说了句:你代码能力不是很好!我当时就受了打击。回来后来不断的回想,到底是哪里写的不入流,这么的不堪入目。

我想到了几点:

1、命名不是很规范,如len1,len2

2、出现了类似start += 5这样的易写难改的赋值,最好将常量赋给一个变量来管理,int size = 5; start += size;

3、解决问题的方式没有通用性,换一个模式串,就要修改代码

4、函数传递的参数没有想清楚,这在定义接口时,是致命的问题

细节中告诉别人的是写代码的素养,素养是靠代码的行数积累养成的,多写是前提但写前一定要三思。


### 多个字符串间最长公共子的算法实现 对于多个字符串间的最长公共子问题,可以采用动态规划方法来高效解决问题。当处理超过两个字符串的情况时,通常先找出任意两者的最长公共子作为基础,再逐步与其他剩余字符串对比,最终获得所有输入字符串共有的最长部分。 #### 动态规划解决方案概述 通过构建二维数组`dp[i][j]`表示第一个字符串前i个字符与第二个字符串前j个字符的最大匹配长度。如果当前字符相同,则`dp[i][j]=dp[i-1][j-1]+1`; 否则置零重新开始计算新的可能序列起点[^2]。 为了扩展到N个字符串的情形下寻找共同子1. 初始化阶段选取其中一对进行上述过程得到初步结果; 2. 将此结果视为新模板依次同其余各成员做相似操作直至遍历结束; 3. 记录过程中遇到的最大值及其对应位置以便最后输出具体字串内容。 以下是Python语言的具体编码实例: ```python def longest_common_substring(strings): def lcs_of_two(str_a, str_b): m, n = len(str_a), len(str_b) dp = [[0]*(n+1) for _ in range(m+1)] max_length = 0 end_pos = 0 for i in range(1,m+1): for j in range(1,n+1): if str_a[i-1]==str_b[j-1]: dp[i][j]=dp[i-1][j-1]+1 if dp[i][j]>max_length: max_length=dp[i][j] end_pos=i else: dp[i][j]=0 return str_a[end_pos-max_length:end_pos] common_substr=strings[0] for s in strings[1:]: common_substr=lcs_of_two(common_substr,s) return common_substr if __name__=='__main__': test_strings=["acbcbcef","abcbced","abcde"] result=longest_common_substring(test_strings) print(f"The longest common substring is '{result}'") ``` 该程序定义了一个辅助函数用于求取每两次迭代中的最长公共子,并不断更新这个“标准”,直到完成全部给定字符串列表的遍历工作为止。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值