Bigram分词

Bigram分词

一、问题描述

给出第一个词 first 和第二个词 second,考虑在某些文本 text 中可能以 “first second third” 形式出现的情况,其中 second 紧随 first 出现,third 紧随 second 出现。

对于每种这样的情况,将第三个词 “third” 添加到答案中,并返回答案。

示例1:

     输入:text = "alice is a good girl she is a good student",
      first = "a", second = "good"
      输出:["girl","student"]

示例2:

     输入:text = "we will we will rock you",
      first = "we", second = "will"
      输出:["we","rock"]

二、解题思路

  • 利用字符串分隔符split()将文本text分隔成多个字符串,并返回包含分隔结果的列表text_list;
  • 利用enumerate()函数,分别将将text_list里的每个单词赋给word,单词所在下标赋给index
  • 判断异常情况:如果所给的first,second是文本最后的两个单词则退出
  • 当找到first和second时—word==fiest,text_list[index+1]==second时,利用列表插入方法append()–用于向列表尾部追加一个元素,找到"third"单词

三、核心代码

  • 测试
    在这里插入图片描述
  • 普适
    在这里插入图片描述

四、测试

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值