LeetCode刷题NO.1078——Bigram 分词

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/occurrences-after-bigram

【题目描述】
给出第一个词 first 和第二个词 second,考虑在某些文本 text 中可能以 “first second third” 形式出现的情况,其中 second 紧随 first 出现,third 紧随 second 出现。

对于每种这样的情况,将第三个词 “third” 添加到答案中,并返回答案。

【示例】
示例 1:

输入:text = "alice is a good girl she is a good student", first = "a", second = "good"
输出:["girl","student"]

示例 2:

输入:text = "we will we will rock you", first = "we", second = "will"
输出:["we","rock"]

提示:

  • 1 <= text.length <= 1000
  • text 由小写英文字母和空格组成
  • text 中的所有单词之间都由 单个空格字符 分隔
  • 1 <= first.length, second.length <= 10
  • first 和 second 由小写英文字母组成

【解题思路】
根据题意可知,如果text中连续出现firstsecond,那么我们需要把second后面的单词添加到输出列表中(前提是second后面还有单词),详细过程如下:

  1. text按照字符空格“ ”进行切分,即分词,并获取分词后的单词个数,分别用wordsword_num表示分词结果和分词后的单词个数
  2. 定义输出列表output
  3. 遍历words,如果words[i]==first and words[i+1]==second,其中i=0, 1, 2, ..., word_num-3,则words[i+2]即为我们要找的单词,把它添加到输出列表中。即如果该单词等于first且后一个单词等于second,则把second后面的单词添加到输出队列

【提交代码】

class Solution:
    def findOcurrences(self, text: str, first: str, second: str) -> List[str]:
        words = text.split(" ")
        word_num = len(words)
        
        output = []
        for i in range(word_num-2):
            if words[i] == first and words[i+1] == second:
                output.append(words[i+2])
        
        return output

【运行结果】
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值