设计程序目的:
我们的程序允许用户在一个给定的文件中查询单词。查询结构是单词在文件中出现的次数及其所在行的列表。如果单词在一行中出现多次,此行只列一次,行按升序输出。
设计方案:
(1) 我们将用一个vector<string>来保存整个输入文件的一份拷贝。输入文件中的每行保存为vector中的一个元素。当需要打印一行内容时,可以用行号作为下标来提取文本。
(2)我们使用一个istringstream来将每行分解为单词。
(3)我们使用一个set来保存每个单词在输入文本中出现的行号。保证了每行只出现一次而且行号按升序保存。
(4)我们使用一个map来将每个单词与它出现的行号set关联起来。这样我们就可以提取任意单词的set。
代码:
// TextQuery.h
#pragma once
#include <string>
#include <vector>
#include <map>
#include <set>
#include <iostream>
#include <fstream>
#include <sstream>
#include <memory>
using namespace std;
class QueryResult;
class TextQuery
{
public:
using line_no = vector<string>::size_type;
TextQuery(ifstream &is);
~TextQuery();
QueryResult query(const string &sought) const;
private:
shared_ptr<vector<string>> file; // 输入文件
map<string, shared_ptr<set<line_no>>> wm; // 每个单词到它所在的行号的集合的映射
};
class QueryResult
{
friend ostream &print(ostream &os, const QueryResult &qr);
public:
using line_no = vector<string>::size_type;
QueryResult(string s,
shared_ptr<set<line_no>> p,
shared_ptr<vector<string>> f) :sought(s), lines(p), file(f) {}
private:
string sought; // 查询单词
shared_ptr<set<line_no>> lines; // 出现的行号
shared_ptr<vector<string>> file; // 输入的文件
};
// TextQuery.cpp
#include "TextQuery.h"
// 读取输入文件并建立单词到行号的映射
TextQuery::TextQuery(ifstream &is):file(new vector<string>)
{
string text;
while (getline(is, text))
{
file->push_back(text); // 保存此行文本
int n = file->size() - 1; // 当前最大行号
istringstream line(text);
string word;
while (line >> word)
{
// 如果单词不在wm中,以之为下标在wm中添加一项
shared_ptr<set<line_no>> &lines = wm[word];
if (nullptr == lines) // 在我们第一次遇到这个单词时,此指针为空
{
lines.reset(new set<line_no>); // 分配一个新的set
}
lines->insert(n); // 将此行号插入set中
}
}
}
TextQuery::~TextQuery()
{
}
QueryResult TextQuery::query(const string &sought) const
{
static shared_ptr<set<line_no>> nodata(new set<line_no>);
auto loc = wm.find(sought);
if (loc == wm.end())
return QueryResult(sought, nodata, file); // 未找到
else
return QueryResult(sought, loc->second, file);
}
ostream &print(ostream &os, const QueryResult &qr)
{
os << qr.sought << " occurs " << qr.lines->size() << " "
<< ((qr.lines->size() > 1) ? "times" : "time") << endl;
for (auto num : *qr.lines)
{
os << "\t(lines " << num + 1 << "): " << *(qr.file->begin() + num) << endl;
}
return os;
}
mian()调用,其中file1.txt文件中保存了《数据结构与算法分析_C语言描述》英文版前言中对各章节的介绍部分,现需要查询单词“algorithm”在file1.txt中出现的次数,以及所在的行的内容。
#include "TextQuery.h"
int main()
{
ifstream is("file1.txt");
TextQuery tq(is);
QueryResult qr = tq.query("algorithm");
print(cout, qr);
is.close();
return 0;
}
查询结果为: