文本查询程序

设计程序目的

我们的程序允许用户在一个给定的文件中查询单词。查询结构是单词在文件中出现的次数及其所在行的列表。如果单词在一行中出现多次,此行只列一次,行按升序输出。

设计方案

(1) 我们将用一个vector<string>来保存整个输入文件的一份拷贝。输入文件中的每行保存为vector中的一个元素。当需要打印一行内容时,可以用行号作为下标来提取文本。

(2)我们使用一个istringstream来将每行分解为单词。

(3)我们使用一个set来保存每个单词在输入文本中出现的行号。保证了每行只出现一次而且行号按升序保存。

(4)我们使用一个map来将每个单词与它出现的行号set关联起来。这样我们就可以提取任意单词的set。

代码

// TextQuery.h

#pragma once
#include <string>
#include <vector>
#include <map>
#include <set>
#include <iostream>
#include <fstream>
#include <sstream>
#include <memory>

using namespace std;

class QueryResult;
class TextQuery
{
public:
	using line_no = vector<string>::size_type;

	TextQuery(ifstream &is);
	~TextQuery();

	QueryResult query(const string &sought) const;

private:
	shared_ptr<vector<string>>            file;     // 输入文件
	map<string, shared_ptr<set<line_no>>> wm;       // 每个单词到它所在的行号的集合的映射
};

class QueryResult
{
	friend ostream &print(ostream &os, const QueryResult &qr);

public:
	using line_no = vector<string>::size_type;
	QueryResult(string s,
		shared_ptr<set<line_no>> p,
		shared_ptr<vector<string>> f) :sought(s), lines(p), file(f) {}

private:
	string sought;                       // 查询单词
	shared_ptr<set<line_no>>   lines;    // 出现的行号
	shared_ptr<vector<string>> file;     // 输入的文件
};

// TextQuery.cpp

#include "TextQuery.h"

// 读取输入文件并建立单词到行号的映射
TextQuery::TextQuery(ifstream &is):file(new vector<string>)
{
	string text;
	while (getline(is, text))           
	{
		file->push_back(text);         // 保存此行文本
		int n = file->size() - 1;      // 当前最大行号

		istringstream line(text);
		string word;
		while (line >> word)
		{
			// 如果单词不在wm中,以之为下标在wm中添加一项
			shared_ptr<set<line_no>> &lines = wm[word];
			if (nullptr == lines)                                  // 在我们第一次遇到这个单词时,此指针为空
			{
				lines.reset(new set<line_no>);           // 分配一个新的set
			}
			lines->insert(n);                            // 将此行号插入set中
		}
	}
}

TextQuery::~TextQuery()
{
}

QueryResult TextQuery::query(const string &sought) const
{
	static shared_ptr<set<line_no>> nodata(new set<line_no>);
	auto loc = wm.find(sought);

	if (loc == wm.end())
		return QueryResult(sought, nodata, file);         // 未找到
	else
		return QueryResult(sought, loc->second, file);
}

ostream &print(ostream &os, const QueryResult &qr)
{
	os << qr.sought << " occurs " << qr.lines->size() << " "
	   << ((qr.lines->size() > 1) ? "times" : "time") << endl;

	for (auto num : *qr.lines)
	{
		os << "\t(lines " << num + 1 << "): " << *(qr.file->begin() + num) << endl;
	}

	return os;
}

mian()调用,其中file1.txt文件中保存了《数据结构与算法分析_C语言描述》英文版前言中对各章节的介绍部分,现需要查询单词“algorithm”在file1.txt中出现的次数,以及所在的行的内容。

#include "TextQuery.h"

int main()
{
	ifstream is("file1.txt");
	TextQuery tq(is);
	QueryResult qr = tq.query("algorithm");
	print(cout, qr);
	is.close();

	return 0;
}

查询结果为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值