LeetCodes——49. Group Anagrams【MAP】

本文介绍了一种高效的算法,用于将给定字符串数组中的同构字符串(即由相同字符以不同顺序组成的字符串)进行分组。通过使用两种不同的方法实现这一目标,并详细解释了每种方法的时间复杂度及实现细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目要求

Given an array of strings, group anagrams together.
For example, given: [“eat”, “tea”, “tan”, “ate”, “nat”, “bat”],
Return:
[
[“ate”, “eat”,”tea”],
[“nat”,”tan”],
[“bat”]
]
Note: All inputs will be in lower-case.
给定一个字符串的数组,将其中的同构体(类似于“eat”和“tea”)找出来放在一组。输出结果保存这样一个分组。

解题思路1

时间复杂度O(n2):
对于每一个字符串,创建一个统计它字母的vector<\int> v(26),如果两个字符串的v统计数组相同,则为同构体。
用一个map来记录v统计数组和字符串之间的联系:

map<vector<int>,vector<int>> m;
//m.first为统计数组,m.second表示满足这个统计数组的字符串在数组中的下标集合。

则先遍历字符串数组,计算出v统计数组,然后检查在map中是否有出现同样的统计数组,如果有,则在该map元素的second中加入该字符串的下标;如果无,则直接加入map中。
再对map进行遍历,将每一个map元素中的second下标值的字符串找出放在一组中。

C++代码

class Solution {
public:
    vector<vector<string>> groupAnagrams(vector<string>& strs) {
        map<vector<int>, vector<int>> m;
        for (int i = 0; i<strs.size(); i++) {
            vector<int> v = cal(strs[i]);
            map<vector<int>, vector<int>>::iterator it;
            for (it = m.begin(); it != m.end(); it++) {
                if (it->first == v) {
                    it->second.push_back(i);
                    break;
                }
            }
            if (it == m.end()) {
                vector<int> tmp;
                tmp.push_back(i);
                m[v] = tmp;
            }
        }
        vector<vector<string>> res;
        for (auto it = m.begin(); it != m.end(); it++) {
            vector<string> tmp;
            for (int i = 0; i<it->second.size(); i++) {
                tmp.push_back(strs[it->second[i]]);
            }
            res.push_back(tmp);
        }
        return res;
    }
    vector<int> cal(string a) {
        vector<int> v(26, 0);
        for (int i = 0; i<a.length(); i++) {
            v[a[i] - 'a']++;
        }
        return v;
    }
};

最后结果

101 / 101 test cases passed.
Status: Accepted
Runtime: 1731 ms
差点超时

解题思路2

还是利用map,只是map的第一个元素是排序字符串,第二个元素里装有排好序是第一个元素的字符串数组。首先遍历输入数组,将该map构造好,再将该map遍历,就得到了分好组的数组。

class Solution {
public:
    vector<vector<string>> groupAnagrams(vector<string>& strs) {
        map<string,multiset<string>> m;
        for(int i=0;i<strs.size();i++){
            string tmp = strs[i];
            sort(tmp.begin(),tmp.end());
            m[tmp].insert(strs[i]);
        }
        vector<vector<string>> res;
        for (auto it=m.begin();it!=m.end();it++){
            vector<string> v(it->second.begin(),it->second.end());
            res.push_back(v);
        }
        return res;
    }
};

最后结果

101 / 101 test cases passed.
Status: Accepted
Runtime: 39 ms

### 关于 `Group Anagrams` 的实现方法 #### 方法一:基于排序的哈希表 对于每一个字符串,先将其字符按照字典顺序排列得到一个新的字符串作为键值存入哈希表中。由于字母异位词经过这样的处理后会产生相同的键值,因此可以将具有相同键值的所有原始字符串收集起来形成最终的结果集[^1]。 ```cpp vector<vector<string>> groupAnagrams(vector<string>& strs) { unordered_map<string, vector<string>> mp; for (string& str : strs) { string key = str; sort(key.begin(), key.end()); mp[key].push_back(str); } vector<vector<string>> ans; for (auto it = mp.begin(); it != mp.end(); ++it) { ans.push_back(it->second); } return ans; } ``` 这种方法的时间复杂度主要取决于排序操作以及遍历输入列表的操作。如果n表示输入列表长度,k代表最长单词长度,则时间复杂度大约为O(n * k log k)。 #### 方法二:基于计数数组的哈希表 考虑到ASCII码范围内的字符数量有限(共26个小写字母),可以直接利用固定大小(26)的整型数组记录每个字符串内各个字符出现次数的情况,并以此构建唯一的key用于存储到hashmap当中去。这种方式避免了显式的字符串排序过程,在某些情况下可能会更高效一些。 ```cpp vector<vector<string>> groupAnagrams(vector<string>& strs) { unordered_map<string, vector<string>> mp; for (const auto& s : strs){ array<int, 26> counts{}; for(const char c:s){ counts[c-'a']++; } // 将counts转换成可作为key使用的字符串形式 string key = ""; for(auto count:counts){ key += "#"+to_string(count); } mp[key].emplace_back(s); } vector<vector<string>> res; for(auto& p:mp){ res.emplace_back(p.second); } return res; } ``` 此版本通过使用定长的频率分布向量代替直接对字符串进行排序的方式减少了不必要的计算开销,理论上能够提供更好的性能表现。 #### 方法三:质数相乘法 另一种巧妙的做法是给每个不同的字母分配一个独一无二的小质数值,之后把整个字符串看作是由这些质因数构成的大合数;这样只要两个串对应的积相等就说明它们互为变位词。不过这种思路虽然新颖有趣但在实际应用时效率未必占优,因为涉及到大数运算等问题。 ```cpp // 这里仅给出概念性的伪代码示意而非完整的解决方案 unordered_map<long long,vector<string>> map; for each word w do{ product=1; foreach character ch in w do{ product *= primes[ch]; //假设primes[]已经预先定义好并初始化完毕 } map[product].add(w); } return convert(map.values()); // 把map里的value部分转成题目要求的形式返回 ``` 上述三种方式各有特点,可以根据具体场景和个人偏好选择合适的一种来解决问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值