LeetCode 49. 字母异位词分组 Group Anagrams

本文介绍了一种高效的算法来解决字母异位词分组问题。通过两种方法——排序数组分类与按计数分类,文章详细阐述了如何将一组字符串按照是否为字母异位词进行分组。同时分析了这两种方法的时间与空间复杂度。

给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。

示例:

输入:
["eat", "tea", "tan", "ate", "nat", "bat"]
,
输出:
[
  ["ate","eat","tea"],
  ["nat","tan"],
  ["bat"]
]

说明:

  • 所有输入均为小写字母。
  • 不考虑答案输出的顺序。

方法一:排序数组分类

思路

当且仅当它们的排序字符串相等时,两个字符串是字母异位词。

算法

维护一个映射 ans : {String -> List},其中每个键 K\text{K}K 是一个排序字符串,每个值是初始输入的字符串列表,排序时等于 K\text{K}K。

在 Java 中,我们将键存储为字符串,例如,code。 在 Python 中,我们将键存储为散列化元组,例如,('c', 'o', 'd', 'e')

 

复杂度分析

  • 时间复杂度:O(NKlogK)O(NK \log K)O(NKlogK),其中 NNN 是 strs 的长度,而 KKK 是 strs 中字符串的最大长度。当我们遍历每个字符串时,外部循环具有的复杂度为 O(N)O(N)O(N)。然后,我们在 O(KlogK)O(K \log K)O(KlogK) 的时间内对每个字符串排序。

  • 空间复杂度:O(NK)O(NK)O(NK),排序存储在 ans 中的全部信息内容。
     


方法二:按计数分类

思路

当且仅当它们的字符计数(每个字符的出现次数)相同时,两个字符串是字母异位词。

算法

我们可以将每个字符串 s\text{s}s 转换为字符数 count\text{count}count,由26个非负整数组成,表示 a\text{a}a,b\text{b}b,c\text{c}c 的数量等。我们使用这些计数作为哈希映射的基础。

在 Java 中,我们的字符数 count 的散列化表示将是一个用 **#** 字符分隔的字符串。 例如,abbccc 将是#1#2#3#0#0#0 ...#0,其中总共有26个条目。 在 python 中,表示将是一个计数的元组。 例如,abbccc将是(1,2,3,0,0,...,0),其中总共有26个条目。

 

复杂度分析

  • 时间复杂度:O(NK)O(NK)O(NK),其中 NNN 是 strs 的长度,而 KKK 是 strs 中字符串的最大长度。计算每个字符串的字符串大小是线性的,我们统计每个字符串。

  • 空间复杂度:O(NK)O(NK)O(NK),排序存储在 ans 中的全部信息内容。

 

public class Solution {
    public List<List<String>> groupAnagrams(String[] strs) {
        HashMap<String , List<String>> map = new HashMap<> ();

        for(String s : strs) {
            char[] chars = s.toCharArray();
            Arrays.sort(chars);
            String tmp = new String(chars);
            if(map.containsKey(tmp)) {
                map.get(tmp).add(s);
            } else {
                ArrayList<String> list = new ArrayList<>();
                list.add(s);
                map.put(tmp, list);
            }
        }

        List<List<String>> groups =   new ArrayList<> ( map.values());

        for(int i = 0 ; i < groups.size(); i++) {
            List<String> group = groups.get(i);
            String[] ss =  group.toArray(new String[group.size()]);
            Arrays.sort(ss);
            groups.set(i, Arrays.asList(ss));
        }
        return groups;
    }
}

 

 

### 三、LeetCode49题:字母异位词分组Group Anagrams)C++ 实现方法 字母异位词相同字符不同顺序构成的字符串。例如,"eat" 和 "tea" 是字母异位词,它们的字符组成相同,但排列顺序不同。为了解决该问题,可以利用哈希表将相同字母异位词归为一组。 #### 方法一:排序 + 哈希表 该方法的核心思想是:**字母异位词在排序后具有相同字符串形式**。因此,可以将排序后的字符串作为哈希表的键,原始字符串作为值,从而实现分组。 ```cpp #include <vector> #include <string> #include <unordered_map> #include <algorithm> using namespace std; class Solution { public: vector<vector<string>> groupAnagrams(vector<string>& strs) { unordered_map<string, vector<string>> stringmap; for (auto str : strs) { string tmp = str; sort(tmp.begin(), tmp.end()); stringmap[tmp].emplace_back(str); } vector<vector<string>> res; for (auto& pair : stringmap) { res.push_back(pair.second); } return res; } }; ``` 该实现利用了 `unordered_map` 来存储排序后的字符串作为键,并将原始字符串加入对应的列表中。最终遍历哈希表,将所有值合并为结果返回。 #### 方法二:字符计数 + 哈希表 另一种方法是基于字符频率构建键值。对于每个字符串,统计其字符出现的频率,并将该频率作为键。由于字母异位词具有相同的字符频率,因此可以准确地将它们分组。 ```cpp #include <vector> #include <string> #include <map> #include <vector> using namespace std; class Solution { public: vector<vector<string>> groupAnagrams(vector<string>& strs) { map<vector<int>, vector<string>> mp; for (string& str : strs) { vector<int> table(26, 0); for (char c : str) { table[c - 'a']++; } mp[table].push_back(str); } vector<vector<string>> ans; for (auto& pair : mp) { ans.push_back(pair.second); } return ans; } }; ``` 该方法使用 `map<vector<int>, vector<string>>` 作为哈希结构,其中键是长度为26的整数数组,表示每个字母的出现次数,值是对应的字符串列表。 #### 方法三:优化字符计数键 为了进一步优化字符计数法,可以将字符频率转换为字符串形式,例如 `"a:1,b:2,c:0,...z:0"`,从而避免使用 `vector<int>` 作为键,提高效率并减少哈希冲突。 ```cpp #include <vector> #include <string> #include <unordered_map> #include <sstream> using namespace std; class Solution { public: vector<vector<string>> groupAnagrams(vector<string>& strs) { unordered_map<string, vector<string>> res_map; for (string& s : strs) { int count[26] = {0}; for (char c : s) { count[c - 'a']++; } stringstream key; for (int i = 0; i < 26; ++i) { key << 'a' + i << ':' << count[i] << '#'; } res_map[key.str()].push_back(s); } vector<vector<string>> result; for (auto& p : res_map) { result.push_back(p.second); } return result; } }; ``` 该方法通过构建频率字符串作为键,提高了可读性和执行效率,适用于大规模输入数据。 --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值