819. Most Common Word

本文介绍了一种筛选高频单词的算法实现,重点在于处理文本中的标点符号和禁用词汇,通过使用标志位和字符串补充等技巧,有效地统计了非禁用单词的出现频率。
 1 static int wing=[]()
 2 {
 3     std::ios::sync_with_stdio(false);
 4     cin.tie(NULL);
 5     return 0;
 6 }();
 7 
 8 class Solution 
 9 {
10 public:
11     string mostCommonWord(string paragraph, vector<string>& banned) 
12     {
13         unordered_map<string,int> simap;
14         for(string s:banned)
15             simap[s]=-1000;
16         int beg=0,flag=0,max=0;
17         paragraph.push_back(' ');
18         string res;
19         int sz=paragraph.length();
20         for(int i=0;i<sz;i++)
21         {
22             if(isalpha(paragraph[i]))
23                 paragraph[i]=tolower(paragraph[i]);
24             else if(paragraph[i]!=' ')
25             {
26                 flag=1;
27                 continue;
28             }          
29             else
30             {
31                 string cur=paragraph.substr(beg,i-flag-beg);
32                 simap[cur]++;
33                 beg=i+1;
34                 flag=0;
35                 if(simap[cur]>max)
36                 {
37                     res=cur;
38                     max=simap[cur];
39                 }               
40             }
41         }
42         return res;
43     }
44 };

以空格为标志,进行操作。

先把禁止序列扫进map,并将对应的字符串计数器置为-1000,由于段落最长就为1000,这样在扫描段落之后,禁止序列的字符串计数器就不可能为正数,就不会影响到非禁止序列高频单词的筛选。

观察段落序列可以发现,除了首个单词,每个单词前面都是空格,所以我们以空格为判定依据。

遇到字母时,操作只将字母转为小写

遇到非空格非字母,即遇到标点符号时,将标志位置为1,表示在下一个空格前有一个标点符号

遇到空格时,i 代表了空格的下标,beg代表了当前单词序列开始下标,即当前单词的第一个字母下标,用substr将单词提取出来,提取长度为 i-flag-1-beg+1=i-flag-beg

提取出来之后,将单词放入map,并增加计数器,然后比较计数器的值和最大值,进行相应操作。

操作之后,要将beg置为新单词的第一个字母,即i+1,将flag标志置为0。

这里还要注意一点,最后一个单词是以句号结尾的,末尾没有空格,循环不会操作最后一个单词,所以,为了让操作进行完整,在循环前,在段落后面补充了一个空格。

这个题用到了一点技巧性的东西,活用标志位,补充原字符串。

 

转载于:https://www.cnblogs.com/zhuangbijingdeboke/p/9184617.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值