leetcode 438. Find All Anagrams in a String

本文探讨了一种高效算法,用于找出一个字符串中所有指定长度字符串的变位词起始索引。通过多种方法尝试,包括使用哈希表、滑动窗口等技术,最终实现了快速准确地找到所有符合条件的子串。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

438Find All Anagrams in a String

Given a string s and a non-empty string p, find all the start indices of p's anagrams in s.

Strings consists of lowercase English letters only and the length of both strings s and p will not be larger than 20,100.

The order of output does not matter.

Example 1:

Input:
s: "cbaebabacd" p: "abc"

Output:
[0, 6]

Explanation:
The substring with start index = 0 is "cba", which is an anagram of "abc".
The substring with start index = 6 is "bac", which is an anagram of "abc".

Example 2:

Input:
s: "abab" p: "ab"

Output:
[0, 1, 2]

Explanation:
The substring with start index = 0 is "ab", which is an anagram of "ab".
The substring with start index = 1 is "ba", which is an anagram of "ab".
The substring with start index = 2 is "ab", which is an anagram of "ab".

本题总结:

1、哈希表的实现学会用vector<int> 来记录字符串中出现的字符,不一定非要map。

2、特别注意:

if (m[s[right++]]-- > 0)
    --cnt;
//这上下是一样的。就算if不满足。里面的++,--也要执行。而且是外面的先执行。
if (m[s[right]] > 0)
    --cnt;
m[s[right]]--;
right++;


首先用最原始的方式试一试: TLE

class Solution {
public:
    vector<int> findAnagrams(string s, string p) 
    {
        vector<int> ret;
        if (s.size() < p.size()) return ret;
        for (int i = 0; i <= s.size() - p.size(); i++)
        {
            if (thesame(s.substr(i, p.size()), p))
                ret.push_back(i);
        }
        return ret;
    }
    
    bool thesame(string s, string p)
    {
        sort(s.begin(), s.end());
        sort(p.begin(), p.end());
        return s == p;
    }  
};

然后改进一下:还是超时

class Solution {
public:
    vector<int> findAnagrams(string s, string p) 
    {
        vector<int> ret;
        if (s.size() < p.size()) return ret;

        unordered_map<char, int> pp;
        for (int i = 0; i < p.size(); i++)
            pp[p[i]] ++;

        for (int i = 0; i <= s.size() - p.size(); i++)
        {
            if ( thesame(s.substr(i, p.size()), pp) )
                ret.push_back(i);
        }
        return ret;
    }
    
    bool thesame(string s, unordered_map<char, int> pp)
    {
        for (int i = 0; i < s.size(); i++)
        {
            if (pp.find(s[i]) == pp.end())
                return false;
            else
            {
                if ( --pp[s[i]] == 0)
                    pp.erase(s[i]);
            }
        }
        return pp.empty();
    }  
};

看来只能一位一位来:还是TLE

class Solution {
public:
    vector<int> findAnagrams(string s, string p)
    {
        vector<int> ret;
        if (s.size() < p.size()) return ret;

        unordered_map<char, int> pp;
        for (int i = 0; i < p.size(); i++)
            pp[p[i]] ++;

        int startpoint = 0, findnum = 0;
        unordered_map<char, int> tmp = pp;
        for (int i = 0; i < s.size(); i++)
        {
            if (tmp.find(s[i]) == tmp.end())    //如果里面就没有这个char。
            {
                tmp = pp;
                startpoint = i + 1;
                findnum = 0;
                continue;
            }


            if (tmp[s[i]] == 0)
            {
                tmp = pp;
                i = startpoint++;
                findnum = 0;
                continue;
            }
            //合理
            tmp[s[i]] --;
            findnum++;

            if (findnum == p.size())
            {
                ret.push_back(startpoint);
                tmp = pp;
                i = startpoint++;
                findnum = 0;
            }
        }
        return ret;
    }
};

最后只能看网上的解法:https://www.cnblogs.com/grandyang/p/6014408.html


1、552ms。

这道题给了我们两个字符串s和p,让我们在s中找字符串p的所有变位次的位置,所谓变位次就是字符种类个数均相同但是顺序可以不同的两个词,那么我们肯定首先就要统计字符串p中字符出现的次数,然后从s的开头开始,每次找p字符串长度个字符,来验证字符个数是否相同,如果不相同出现了直接break,如果一直都相同了,则将起始位置加入结果res中。

我上面的代码没过应该是用了map的copy。比较慢。

class Solution {
public:
    vector<int> findAnagrams(string s, string p)
    {
        if (s.empty()) return {};
        vector<int> res, cnt(128, 0);
        int ns = s.size(), np = p.size(), i = 0;

        for (char c : p)
            ++cnt[c];

        while (i < ns)
        {
            bool success = true;
            vector<int> tmp = cnt;

            for (int j = i; j < i + np; ++j)
            {
                if (--tmp[s[j]] < 0)
                {
                    success = false;
                    break;
                }
            }

            if (success)
                res.push_back(i);
            ++i;
        }
        return res;
    }
};

2、36ms。

用两个哈希表,分别记录p的字符个数,和s中前p字符串长度的字符个数,然后比较,如果两者相同,则将0加入结果res中,然后开始遍历s中剩余的字符,每次右边加入一个新的字符,然后去掉左边的一个旧的字符,每次再比较两个哈希表是否相同即可

class Solution {
public:
    vector<int> findAnagrams(string s, string p) 
    {
        if (s.empty()) return {};
        vector<int> res, m1(256, 0), m2(256, 0);
        for (int i = 0; i < p.size(); ++i) 
        {
            ++m1[s[i]]; 
            ++m2[p[i]];
        }
        if (m1 == m2) res.push_back(0);
        for (int i = p.size(); i < s.size(); ++i) 
        {
            ++ m1[s[i]]; 
            -- m1[s[i - p.size()]];
            if (m1 == m2) 
                res.push_back(i - p.size() + 1);
        }
        return res;
    }
};

3、32ms

下面这种利用滑动窗口Sliding Window的方法也比较巧妙,首先统计字符串p的字符个数,然后用两个变量left和right表示滑动窗口的左右边界,用变量cnt表示字符串p中需要匹配的字符个数,然后开始循环,如果右边界的字符已经在哈希表中了,说明该字符在p中有出现,则cnt自减1,然后哈希表中该字符个数自减1,右边界自加1,如果此时cnt减为0了,说明p中的字符都匹配上了,那么将此时左边界加入结果res中。如果此时right和left的差为p的长度,说明此时应该去掉最左边的一个字符,我们看如果该字符在哈希表中的个数大于等于0,说明该字符是p中的字符,为啥呢,因为上面我们有让每个字符自减1,如果不是p中的字符,那么在哈希表中个数应该为0,自减1后就为-1,所以这样就知道该字符是否属于p,如果我们去掉了属于p的一个字符,cnt自增1


class Solution {
public:
    vector<int> findAnagrams(string s, string p) 
    {
        if (s.empty()) return {};
        vector<int> res, m(256, 0);
        int left = 0, right = 0, cnt = p.size();
        for (char c : p)
            ++m[c];
        while (right < s.size())
        {
            if (m[s[right++]]-- > 0)
            {
                --cnt;
            }

            if (cnt == 0)
                res.push_back(left);

            if (right - left == p.size() && m[s[left++]]++ >= 0)
                ++cnt;
        }
        return res;
    }
};



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值