PTA新浪微博热门话题c++版——山东科技大学

最新推荐文章于 2024-03-24 16:16:05 发布

原创最新推荐文章于 2024-03-24 16:16:05 发布 · 368 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构

PTA实验专栏收录该内容

20 篇文章

订阅专栏

本文介绍了一个简化版热门话题推荐系统的实现方法，该系统可以从大量英文微博中解析并统计话题的提及次数，最终输出提及次数最多的话题及其提及次数。

题目：
新浪微博可以在发言中嵌入“话题”，即将发言中的话题文字写在一对“#”之间，就可以生成话题链接，点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表，并将最热门的话题放在醒目的位置推荐大家关注。
本题目要求实现一个简化的热门话题推荐功能，从大量英文（因为中文分词处理比较麻烦）微博中解析出话题，找出被最多条微博提到的话题。
输入格式:
输入说明：输入首先给出一个正整数N（≤1e5），随后N行，每行给出一条英文微博，其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题，输入保证#成对出现。
输出格式:
第一行输出被最多条微博提到的话题，第二行输出其被提到的微博条数。如果这样的话题不唯一，则输出按字母序最小的话题，并在第三行输出And k more …，其中k是另外几条热门话题的条数。输入保证至少存在一条话题。
注意：两条话题被认为是相同的，如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后，它们是相同的字符串；同时它们有完全相同的分词。输出时除首字母大写外，只保留小写英文字母和数字，并用一个空格分隔原文中的单词。
输入样例:

4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic

输出样例:

Hot
2
And 1 more

一开始没注意到这个题有很多坑点，看了别人的代码后才明白
参考这个大佬的代码
STL真好，迭代器真好
别忘了getchar

#include<bits/stdc++.h>
using namespace std;
map<string,int> mp;
string s;
string set_string(string ss)
{
    string cnt;
    bool is_repeat=false;
    for(int i=0; i<ss.length(); i++)
    {
        if(ss[i]>='A'&&ss[i]<='Z')
        {
            cnt+=(ss[i]-'A'+'a');
            is_repeat=false;
        }
        else if((ss[i]>='a'&&ss[i]<='z')||(ss[i]>='0'&&ss[i]<='9'))
        {
            cnt+=ss[i];
            is_repeat=false;
        }
        else if(!is_repeat)
        {
            cnt+=' ';
            is_repeat=true;
        }
    }
    if(cnt[cnt.length()-1]==' ')
        cnt.erase(cnt.end()-1);
    return cnt;
}
string cmp(string s1,string s2)
{
    return s1<s2?s1:s2;
}
int main()
{
    //freopen("in.txt","r",stdin);
    int n;
    cin>>n;
    getchar();//又特么的忘了
    while(n--)
    {
        map<string,int> small_map;
        string ss;
        getline(cin,s);
        for(int i=0; i<s.length(); i++)
        {
            ss="";
            if(s[i]=='#')
            {
                i++;
                while(s[i]!='#')
                    ss+=s[i++];
                ss=set_string(ss);
            }
            if(ss=="")
                continue;
            small_map[ss]++;
        }
        map<string,int>::iterator it;
        for(it=small_map.begin(); it!=small_map.end(); it++)
        {
            mp[it->first]++;
        }
    }
    int maxn=0,repeat=0;
    map<string,int>::iterator it;
    for(it=mp.begin();it!=mp.end();it++)
    {
        if(it->second>maxn)
        {
            maxn=it->second;
            s=it->first;
            repeat=0;
        }
        else if(it->second==maxn)
        {
            s=cmp(s,it->first);
            repeat++;
        }
    }
    cout<<(char)(s[0]-'a'+'A');
    for(int i=1;i<s.length();i++)
        cout<<s[i];
    cout<<endl<<maxn<<endl;
    if(repeat)
        cout<<"And "<<repeat<<" more ..."<<endl;
}