leedcode:单词的压缩解码

3.28日:单词的压缩编码

给定一个单词列表,我们将这个列表编码成一个索引字符串 S 与一个索引列表 A。

例如,如果这个列表是 [“time”, “me”, “bell”],我们就可以将其表示为 S = “time#bell#” 和 indexes = [0, 2, 5]。

对于每一个索引,我们可以通过从字符串 S 中索引的位置开始读取字符串,直到 “#” 结束,来恢复我们之前的单词列表。

那么成功对给定单词列表进行编码的最小字符串长度是多少呢?

示例:
输入:words = ['time','me','bell']
输出:10
说明:S = "time#bell#",index = [0,2,5]

提示:

1 <= words.length <= 2000

1 <= words[i].length <= 7

每个单词都是小写字母

第一种方法:反转排序法

可以根据下面这张图片理解题意,再看其他便会好很多。

思路:如果有一对单词s和t,使得t是s的后缀,例如metime的后缀,就删除单词t。最后剩下的单词,就构成了索引字符串的单词。

举个例子:['time','me','lime','sometime','hell','shell']几个单词反转后排序,如下图:

发现:如果 ts 的后缀,则反转之后 t’ 就是 s’ 的前缀。在反转和排序后,s’ 一定会跟在 t’ 的后面!

public int mininumLengthEncoding(String[] words){
    //获取长度
    int N = words.length;
    String[] reversed_words = new String[N];
    for (int i = 0;i < N;i++){
        String word = words[i];
        //String类是不可变类,任何对String的改变都会引发新的String对象的产生,而StringBuilder不会,且不支持并发操作,线程不安全
        String rword = new StringBuilder(word).reverse().toString();
        reversed_words[i] = rword;
    }
    //字典序排序
    Arrays.sort(reversed_words);
    
    int res = 0;
    for (int i = 0;i < N;i++){
        if (i + 1 < N && reversed_words[i+1].startWith(reversed_words[i])){
            //当前单词是下一个单词的前缀,则丢弃
        } else {
            //单词加上一个"#"的长度
            res += reversed_words[i].length() + 1;
        }
    }
    return res;
}
第二种方法:字典树/Trie树/前缀树

字典树又名前缀树,Trie树,是一种存储大量字符串的树形数据结构,相比于HashMap存储,在存储单词(和语种无关,任意语言都可以)的场景上,节省了大量的内存空间。

下图演示了一个保存了8个单词的字典树的结构,8个单词分别是:“A”, “to”, “tea”, “ted”, “ten”, “i”, “in”, “inn”.

从上图可以发现:每条从根节点到叶子节点的路径都构成了单词(有的不需要走到叶子节点也是单词,比如 “i” 和 “in”)。

因为我们需要知道单词列表里,哪些单词是其它某个单词的后缀。既然要求的是后缀,我们只要把单词的倒序插入字典树,再用字典树判断某个单词的逆序是否出现在字典树里就可以了。

class Solution {
    public int minimumLengthEncoding(String[] words) {
        int len = 0;
        Trie trie = new Trie();
        // 先对单词列表根据单词长度由长到短排序
        Arrays.sort(words, (s1, s2) -> s2.length() - s1.length());
        // 单词插入trie,返回该单词增加的编码长度
        for (String word: words) {
            len += trie.insert(word);
        }
        return len;
    }
}

// 定义tire
class Trie {
    
    TrieNode root;
    
    public Trie() {
        root = new TrieNode();
    }

    public int insert(String word) {
        TrieNode cur = root;
        boolean isNew = false;
        // 倒着插入单词
        for (int i = word.length() - 1; i >= 0; i--) {
            int c = word.charAt(i) - 'a';
            if (cur.children[c] == null) {
                isNew = true; // 是新单词
                cur.children[c] = new TrieNode();
            }
            cur = cur.children[c];
        }
        // 如果是新单词的话编码长度增加新单词的长度+1,否则不变。
        return isNew? word.length() + 1: 0;
    }
}

class TrieNode {
    char val;
    TrieNode[] children = new TrieNode[26];

    public TrieNode() {}
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值