题目:编写程序,读入几行文本,并打印一个表格,显示每个不同单词在文本中出现的次数。
算法步骤:
1.预处理。 读入文本文件,将文本中每一行读入到字符串tmp中,使用append函数将tmp添加到字符串s中。
ifstream input("file.txt");
if (!input)
{
cerr << "The file cannot open." << endl;
exit(1);
}
string s="", tmp;
//将所有文本读入放在s中;
while (getline(input, tmp))
{
s.append(tmp);
tmp.clear();
}
2.去除标点符号。将s中的所有标点符号用空格" "代替,关键点:使用ispunct()函数判断是否为标点符号。
//将s中的所有标点符号用" "代替
for (size_t i = 0; i < s.length(); i++)
{
if (ispunct(s[i]))//判断是否为标点符号
s[i]=' ';//string串中的每个元素是字符而不是字符串
}
3.统计单词。在处理好的字符串s中提取每个单词,方法:创建stringstream对象ss,将s输入到缓冲区ss 中,再将缓冲区中的每个单词输出到string类型的word中。创建unordered_map,判断再unordered_map中是否存在word,若存在则在对应关键字的value上进行+1操作,否则,插入一个键值对。Ps:stringstream的用法参见https://blog.youkuaiyun.com/nwpu_yike/article/details/22100615。
//统计单词
string word;
stringstream ss(s);//将字符串s放到s流缓冲区中
unordered_map<string, int> strMap;
unordered_map<string, int>::iterator it;
while (ss >> word)
{
it= strMap.find(word);
if (it == strMap.end())
{
strMap.insert(make_pair(word, 1));
}
else
strMap[word]++;
}
运行结果:
完整代码:
#include <iostream>
#include <fstream>
#include <string>
#include <unordered_map>
#include <iomanip>
#include <sstream>
using namespace std;
int main()
{
ifstream input("file.txt");
if (!input)
{
cerr << "The file cannot open." << endl;
exit(1);
}
string s="", tmp;
//将所有文本读入放在s中;
while (getline(input, tmp))
{
s.append(tmp);
tmp.clear();
}
//将s中的所有标点符号用" "代替
for (size_t i = 0; i < s.length(); i++)
{
if (ispunct(s[i]))//判断是否为标点符号
s[i]=' ';//string串中的每个元素是字符而不是字符串
}
//统计单词
string word;
stringstream ss(s);//将字符串s放到s流缓冲区中
unordered_map<string, int> strMap;
unordered_map<string, int>::iterator it;
while (ss >> word)
{
it= strMap.find(word);
if (it == strMap.end())
{
strMap.insert(make_pair(word, 1));
}
else
strMap[word]++;
}
cout << setw(10) << "Words" << setw(10) << "number"<<endl;
for (auto item : strMap)
{
cout << setw(10) << item.first << setw(10) << item.second << endl;
}
}
参考博文:https://blog.youkuaiyun.com/Gorgeous_mj/article/details/90317704