统计不同单词在文本中出现的次数

题目:编写程序,读入几行文本,并打印一个表格,显示每个不同单词在文本中出现的次数。

算法步骤:

1.预处理。 读入文本文件,将文本中每一行读入到字符串tmp中,使用append函数将tmp添加到字符串s中。

ifstream input("file.txt");
	if (!input)
	{
		cerr << "The file cannot open." << endl;
		exit(1);
	}
	string s="", tmp;
	
	//将所有文本读入放在s中;
	while (getline(input, tmp))
	{
		s.append(tmp);
		tmp.clear();
	}

2.去除标点符号。将s中的所有标点符号用空格" "代替,关键点:使用ispunct()函数判断是否为标点符号。

//将s中的所有标点符号用" "代替
	for (size_t i = 0; i < s.length(); i++)
	{
		if (ispunct(s[i]))//判断是否为标点符号
			s[i]=' ';//string串中的每个元素是字符而不是字符串
	} 

3.统计单词。在处理好的字符串s中提取每个单词,方法:创建stringstream对象ss,将s输入到缓冲区ss 中,再将缓冲区中的每个单词输出到string类型的word中。创建unordered_map,判断再unordered_map中是否存在word,若存在则在对应关键字的value上进行+1操作,否则,插入一个键值对。Ps:stringstream的用法参见https://blog.youkuaiyun.com/nwpu_yike/article/details/22100615

//统计单词
	string word;
	stringstream ss(s);//将字符串s放到s流缓冲区中
	unordered_map<string, int> strMap;
	unordered_map<string, int>::iterator it;
	while (ss >> word)
	{
		it= strMap.find(word);
		if (it == strMap.end())
		{
			strMap.insert(make_pair(word, 1));
		}
		else
			strMap[word]++;
	}

运行结果:

完整代码:

#include <iostream>
#include <fstream>
#include <string>
#include <unordered_map>
#include <iomanip>
#include <sstream>
using namespace std;

int main()
{
	ifstream input("file.txt");
	if (!input)
	{
		cerr << "The file cannot open." << endl;
		exit(1);
	}
	string s="", tmp;
	
	//将所有文本读入放在s中;
	while (getline(input, tmp))
	{
		s.append(tmp);
		tmp.clear();
	}
	
	//将s中的所有标点符号用" "代替
	for (size_t i = 0; i < s.length(); i++)
	{
		if (ispunct(s[i]))//判断是否为标点符号
			s[i]=' ';//string串中的每个元素是字符而不是字符串
	} 
	
	//统计单词
	string word;
	stringstream ss(s);//将字符串s放到s流缓冲区中
	unordered_map<string, int> strMap;
	unordered_map<string, int>::iterator it;
	while (ss >> word)
	{
		it= strMap.find(word);
		if (it == strMap.end())
		{
			strMap.insert(make_pair(word, 1));
		}
		else
			strMap[word]++;
	}

	cout << setw(10) << "Words" << setw(10) << "number"<<endl;
	for (auto item : strMap)
	{
		cout << setw(10) << item.first << setw(10) << item.second << endl;
	}
}

参考博文:https://blog.youkuaiyun.com/Gorgeous_mj/article/details/90317704

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值