Leetcode49--字母异位词分组

本文介绍了一种有效的算法,用于将一组字符串中的字母异位词进行分组。通过字符串排序和哈希映射的方法,实现了快速准确的字母异位词识别与归类。

给定一个字符串数组,将字母异位词组合在一起。字母异位词指字母相同,但排列不同的字符串。

示例:

输入: ["eat", "tea", "tan", "ate", "nat", "bat"],
输出:
[
  ["ate","eat","tea"],
  ["nat","tan"],
  ["bat"]
]

 

思路: 没什么可说的,直接是先将各个字符串内部按照字典排序(开辟额外空间),然后根据排序后的结果组成若干个字符串的集合。另外现在知道了Python不同于C++,无法直接对字符串引用sort函数(参数错误),要先转成list再balabala,很麻烦。

 

解法1(在最后那个上万字符串的输入下,会TLE):

class Solution(object):
    def groupAnagrams(self, strs):
        """
        :type strs: List[str]
        :rtype: List[List[str]]
        """
        res = []
        tmp = []
        flag = [False] * len(strs)  # 判断是否已添加相应字符串

        # 字符串排序
        for i in strs:
            t1 = "".join((lambda x: (x.sort(), x)[1])(list(i)))
            tmp.append(t1)

        for i in range(len(tmp)):
            if flag[i] == True:
                continue
            out = []
            flag[i] = True
            out.append(strs[i])
            for j in range(i, len(tmp)):
                if flag[j] == True:
                    continue
                if tmp[j] == tmp[i]:
                    flag[j] = True
                    out.append(strs[j])
            res.append(out)

        return res

解法2(抄来的,利用hash即字典,建立对应字符串排序后作为键与原字符串作为值的映射)

class Solution(object):
    def groupAnagrams(self, strs):
        """
        :type strs: List[str]
        :rtype: List[List[str]]
        """
        res = []
        dic = {}
        for s in strs:
            keys = "".join(sorted(s))
            if keys not in dic:
                dic[keys] = [s]
            else:
                dic[keys].append(s)
        return list(dic.values())

 

### 三、LeetCode49题:字母异位词分组(Group Anagrams)C++ 实现方法 字母异位词是指由相同字符不同顺序构成的字符串。例如,"eat" 和 "tea" 是字母异位词,它们的字符组成相同,但排列顺序不同。为了解决该问题,可以利用哈希表将相同字母异位词归为一组。 #### 方法一:排序 + 哈希表 该方法的核心思想是:**字母异位词在排序后具有相同的字符串形式**。因此,可以将排序后的字符串作为哈希表的键,原始字符串作为值,从而实现分组。 ```cpp #include <vector> #include <string> #include <unordered_map> #include <algorithm> using namespace std; class Solution { public: vector<vector<string>> groupAnagrams(vector<string>& strs) { unordered_map<string, vector<string>> stringmap; for (auto str : strs) { string tmp = str; sort(tmp.begin(), tmp.end()); stringmap[tmp].emplace_back(str); } vector<vector<string>> res; for (auto& pair : stringmap) { res.push_back(pair.second); } return res; } }; ``` 该实现利用了 `unordered_map` 来存储排序后的字符串作为键,并将原始字符串加入对应的列表中。最终遍历哈希表,将所有值合并为结果返回。 #### 方法二:字符计数 + 哈希表 另一种方法是基于字符频率构建键值。对于每个字符串,统计其字符出现的频率,并将该频率作为键。由于字母异位词具有相同的字符频率,因此可以准确地将它们分组。 ```cpp #include <vector> #include <string> #include <map> #include <vector> using namespace std; class Solution { public: vector<vector<string>> groupAnagrams(vector<string>& strs) { map<vector<int>, vector<string>> mp; for (string& str : strs) { vector<int> table(26, 0); for (char c : str) { table[c - 'a']++; } mp[table].push_back(str); } vector<vector<string>> ans; for (auto& pair : mp) { ans.push_back(pair.second); } return ans; } }; ``` 该方法使用 `map<vector<int>, vector<string>>` 作为哈希结构,其中键是长度为26的整数数组,表示每个字母的出现次数,值是对应的字符串列表。 #### 方法三:优化字符计数键 为了进一步优化字符计数法,可以将字符频率转换为字符串形式,例如 `"a:1,b:2,c:0,...z:0"`,从而避免使用 `vector<int>` 作为键,提高效率并减少哈希冲突。 ```cpp #include <vector> #include <string> #include <unordered_map> #include <sstream> using namespace std; class Solution { public: vector<vector<string>> groupAnagrams(vector<string>& strs) { unordered_map<string, vector<string>> res_map; for (string& s : strs) { int count[26] = {0}; for (char c : s) { count[c - 'a']++; } stringstream key; for (int i = 0; i < 26; ++i) { key << 'a' + i << ':' << count[i] << '#'; } res_map[key.str()].push_back(s); } vector<vector<string>> result; for (auto& p : res_map) { result.push_back(p.second); } return result; } }; ``` 该方法通过构建频率字符串作为键,提高了可读性和执行效率,适用于大规模输入数据。 --- ###
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值