使用c++找到字符串中所有字母异位词

文章介绍了如何使用C++的滑动窗口算法和哈希表来找到字符串中所有给定单词的字母异位词,提供了一个具体的代码实现,并详细解释了代码逻辑。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在本文中,我们将探讨如何使用C++找到字符串中所有字母异位词。这是一个常见的问题,在字符串处理中经常遇到。我们将从问题的定义开始,逐步介绍解决方案。

问题定义

给定两个字符串s和p,找到s中所有p的异位词的子串,返回这些子串的起始索引。异位词指由相同字母重排列形成的字符串(包括相同的字符串)。

解决方案

我们可以使用滑动窗口算法来解决这个问题。滑动窗口算法是一种常见的字符串处理算法,它可以在O(n)的时间复杂度内解决很多字符串处理问题。

我们可以定义两个指针left和right,分别指向滑动窗口的左右端点。我们可以通过移动right指针来扩大窗口,移动left指针来缩小窗口。在每次移动指针之后,我们可以检查窗口内的字符串是否符合条件。如果符合条件,则记录窗口左端点的索引。

具体实现

我们可以使用一个哈希表来记录p字符串中每个字符出现的次数。然后我们可以遍历s字符串,对于每个位置i,我们可以维护一个长度为p.size()的滑动窗口。在滑动窗口内,我们可以使用一个哈希表来记录s字符串中每个字符出现的次数。在每次移动窗口之后,我们可以比较两个哈希表是否相等,如果相等,则说明当前窗口是一个符合条件的字母异位词。我们可以记录窗口左端点的索引,并继续向右移动窗口。

代码实现

下面是使用C++实现的代码:

```

vector<int> findAnagrams(string s, string p) {
    vector<int> res;
    unordered_map<char, int> m;
    for (char c : p) m[c]++;
    int left = 0, right = 0, count = p.size();
    while (right < s.size()) {
        if (m[s[right++]]-- >= 1) count--;
        if (count == 0) res.push_back(left);
        if (right - left == p.size() && m[s[left++]]++ >= 0) count++;
    }
    return res;
}


```

代码解释

我们首先定义一个空的vector res,用于存储符合条件的字母异位词的起始索引。然后我们使用一个哈希表m来记录p字符串中每个字符出现的次数。接下来,我们定义三个变量left、right和count,其中left和right分别指向滑动窗口的左右端点,count表示当前窗口内还需要匹配的字符数,初始值为p.size()。

接下来,我们使用while循环遍历s字符串。在每次循环中,我们首先将right指针向右移动一位,并将哈希表m中对应字符的出现次数减1。如果减1后出现次数仍大于等于1,则说明当前字符在p字符串中出现过,并且在当前窗口内还需要匹配。因此,我们将count减1。

然后,我们检查count是否为0。如果count为0,则说明当前窗口是一个符合条件的字母异位词。因此,我们记录窗口左端点的索引,并将其加入res数组中。

接下来,我们检查当前窗口是否达到了p字符串的长度。如果达到了,则需要将左端点向右移动一位,并将哈希表m中对应字符的出现次数加1。如果加1后出现次数大于等于0,则说明当前字符在p字符串中出现过,并且在当前窗口外还需要匹配。因此,我们将count加1。

最后,我们返回res数组,其中存储了所有符合条件的字母异位词的起始索引。

总结

在本文中,我们介绍了如何使用C++找到字符串中所有字母异位词。我们使用了滑动窗口算法,并结合哈希表来解决这个问题。这是一个常见的问题,在字符串处理中经常遇到。通过本文的介绍,相信读者已经对该问题有了更深入的理解,并能够灵活运用该算法解决其他相关问题。

### C++ 实现字母异位词检测算法 #### 方法一:基于排序的解决方案 通过将字符串中的字符按照字典序排序,可以判断两个字符串是否为字母异位词。如果排序后的结果相同,则它们互为字母异位词。 以下是具体的实现代码: ```cpp #include <vector> #include <string> #include <unordered_map> #include <algorithm> using namespace std; vector<vector<string>> groupAnagrams(vector<string>& strs) { unordered_map<string, vector<string>> map; for (const string& str : strs) { string key = str; sort(key.begin(), key.end()); // 对字符串进行排序作为键值 map[key].push_back(str); // 将原始字符串存入对应的键值下 } vector<vector<string>> result; for (auto& pair : map) { result.push_back(pair.second); } return result; } ``` 上述代码的核心逻辑在于利用哈希表存储排序后的字符串及其对应的所有异位词[^3]。最终返回的是一个二维向量,其中每一维包含了属于同一组的字母异位词。 --- #### 方法二:计数法 另一种常见的方法是统计每个字符串中各个字符的数量,并以此来区分不同的字母异位词组合。这种方法不需要对字符串本身进行排序操作,而是通过对字符频率的比较完成分类。 下面是具体实现方式: ```cpp #include <vector> #include <string> #include <unordered_map> #include <algorithm> using namespace std; vector<vector<string>> groupAnagramsCounting(vector<string>& strs) { unordered_map<string, vector<string>> map; for (const string& str : strs) { int count[26] = {0}; // 假设输入只包含小写字母 for (char c : str) { count[c - 'a']++; // 记录每个字符出现次数 } string key = ""; for (int i = 0; i < 26; ++i) { if (count[i]) { key += '#' + to_string(count[i]); // 使用特殊符号'#'连接字符频次形成唯一key } } map[key].push_back(str); // 插入到map中 } vector<vector<string>> result; for (auto& pair : map) { result.push_back(pair.second); } return result; } ``` 此方法通过构建唯一的 `key` 来表示每种可能的字母分布情况,从而避免了显式的排序过程[^4]。 --- #### 示例运行 假设输入如下: ```cpp vector<string> input = {"eat", "tea", "tan", "ate", "nat", "bat"}; ``` 调用函数后输出应为: ```cpp [ ["bat"], ["nat","tan"], ["ate","eat","tea"] ] ``` 这表明程序成功地将所有的字母异位词进行了分组并返回。 --- ### 性能分析 两种方法的时间复杂度均为 O(n * k log k),其中 n 表示输入数组长度,k 则代表单个字符串的最大长度。这是因为我们需要遍历整个数组并对每个字符串执行一次排序或计算其字符频率的操作[^1]。 当数据规模较大或者字符串较长时,第二种方法可能会稍微优于第一种,因为它省去了实际的排序开销而仅依赖于简单的加减运算和字符串拼接。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值