【哈希-简单】720. 词典中最长的单词

该博客介绍了如何利用Trie数据结构解决寻找英语词典中最长单词的问题,该单词由词典中其他单词逐步添加一个字母组成。通过构建前缀树并遍历,找到最长且字典序最小的单词。示例中给出了Python代码实现,并展示了在不同输入情况下的解题思路和结果。

【题目】
给出一个字符串数组words组成的一本英语词典。从中找出最长的一个单词,该单词是由words词典中其他单词逐步添加一个字母组成。若其中有多个可行的答案,则返回答案中字典序最小的单词。
若无答案,则返回空字符串。
【示例 1】
输入:
words = [“w”,“wo”,“wor”,“worl”, “world”]
输出:“world”
解释:
单词"world"可由"w", “wo”, “wor”, 和 "worl"添加一个字母组成。
【示例 2】
输入:
words = [“a”, “banana”, “app”, “appl”, “ap”, “apply”, “apple”]
输出:“apple”
解释:
“apply"和"apple"都能由词典中的单词组成。但是"apple"的字典序小于"apply”。
【提示】
所有输入的字符串都只包含小写字母。
words数组长度范围为[1,1000]。
words[i]的长度范围为[1,30]。
【代码】
【Python】

class Solution:
    def longestWord(self, words: List[str]) -> str:
        words.sort(key=lambda x:(-len(x),x))
        for w in words:
            flag=1
            for i in range(1,len(w)+1):
                if w[:i] not in words:
                    flag=0
                    break
            if flag:
                return w
        return ""

【Trie】

class Solution:
    def longestWord(self, words: List[str]) -> str:
        Trie = {}
        # 构建前缀树
        for word in words:
            print(word,end=" ")
            cur = Trie
            for w in word:
                cur = cur.setdefault(w,{})
            print(Trie,len(Trie))
            cur['#'] = word
            print(Trie,len(Trie))
        
        # 获得根结点
        stack = list(Trie.values())
        print(stack)
        res = ''
        while stack:
            cur = stack.pop()
            # 如果'#'存在,则表明下一个单词有前缀单词,若无则跳过,去兄弟节点
            if '#' in cur:
                # 得到保存的单词
                word = cur['#']
                # 如果长度更长或者相等且字典序更小时,更新
                if len(word)>len(res) or (len(word)==len(res) and word<res):
                    res = word
                # 向下查找它的子结点
                for i in cur:
                    if i!='#':
                        stack.append(cur[i])
        return res
1. 读取一篇包括标点符号的英文文章(InFile.txt),假设文件中单词的个数最多不超过5000个。从文件中读取单词,过滤掉所有的标点。 2. 分别利用线性表(包括基于顺序表的顺序查找、基于链表的顺序查找、折半查找)、二叉排序树和哈希表(包括基于开放地址法的哈希查找、基于链地址法的哈希查找)总计6种不同的检索策略构建单词的存储结构。 3. 不论采取哪种检索策略,完成功能均相同。 (1)词频统计 当读取一个单词后,若该单词还未出现,则在适当的位置上添加该单词,将其词频计为1;若该单词已经出现过,则将其词频增加1。统计结束后,将所有单词及其频率按照词典顺序写入文本文件中。其中,不同的检索策略分别写入6个不同的文件。 基于顺序表的顺序查找--- OutFile1.txt 基于链表的顺序查找--- OutFile2.txt 折半查找--- OutFile3.txt 基于二叉排序树的查找--- OutFile4.txt 基于开放地址法的哈希查找--- OutFile5.txt 基于链地址法的哈希查找--- OutFile6.txt 注:如果实现方法正确,6个文件的内容应该是一致的。 (2)单词检索 输入一个单词,如果查找成功,则输出该单词对应的频率,同时输出查找成功的平均查找长度ASL和输出查找所花费的时间。如果查找失败,则输出“查找失败”的提示。生成一篇c++5.11可以运行的代码
最新发布
06-12
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值