NOIP2010tgD1T1 机器翻译解题报告

最新推荐文章于 2024-12-21 21:15:56 发布

原创最新推荐文章于 2024-12-21 21:15:56 发布 · 353 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#NOIP

解题报告专栏收录该内容

5 篇文章

订阅专栏

本文解析了2010年NOIP机器翻译问题，该问题涉及利用有限内存进行英文单词的中文翻译过程。通过模拟算法实现了翻译过程中对外存词典的查找次数计算。

2010NOIPtgD1T1 机器翻译题目如下

题目背景
小晨的电脑上安装了一个机器翻译软件，他经常用这个软件来翻译英语文章。
题目描述
这个翻译软件的原理很简单，它只是从头到尾，依次将每个英文单词用对应的中文含义来替换。对于每个英文单词，软件会先在内存中查找这个单词的中文含义，如果内存中有，软件就会用它进行翻译；如果内存中没有，软件就会在外存中的词典内查找，查出单词的中文含义然后翻译，并将这个单词和译义放入内存，以备后续的查找和翻译。
假设内存中有M个单元，每单元能存放一个单词和译义。每当软件将一个新单词存入内存前，如果当前内存中已存入的单词数不超过M-1，软件会将新单词存入一个未使用的内存单元；若内存中已存入M个单词，软件会清空最早进入内存的那个单词，腾出单元来，存放新单词。
假设一篇英语文章的长度为N个单词。给定这篇待译文章，翻译软件需要去外存查找多少次词典？假设在翻译开始前，内存中没有任何单词。
输入输出格式
输入格式：
输入文件共2行。每行中两个数之间用一个空格隔开。
第一行为两个正整数M和N，代表内存容量和文章的长度。
第二行为N个非负整数，按照文章的顺序，每个数（大小不超过1000）代表一个英文单词。文章中两个单词是同一个单词，当且仅当它们对应的非负整数相同。
输出格式：
包含一个整数，为软件需要查词典的次数。
输入输出样例
输入样例：
3 7
1 2 1 5 4 4 1
输出样例：
5
说明
每个测试点1s对于10%的数据有M=1，N≤5。
对于100%的数据有0<=M<=100，0<=N<=1000。
整个查字典过程如下：每行表示一个单词的翻译，冒号前为本次翻译后的内存状况：
空：内存初始状态为空。
- 查找单词1并调入内存。
1 2：查找单词2并调入内存。
1 2：在内存中找到单词1。
1 2 5：查找单词5并调入内存。
2 5 4：查找单词4并调入内存替代单词1。
2 5 4：在内存中找到单词4。
5 4 1：查找单词1并调入内存替代单词2。
共计查了5次词典。

看了题目之后，第一反应：这不是个队列么？
后来想了想，在队列里找东西不方便，还是数组模拟吧，简单快捷。
根据题目给的数据n<=100,m<=1000，这道题不需要太精妙的算法，就连Θ(N2)的算法都能过？？？w(ﾟДﾟ)w
所以用数组更方便提取信息，这里还用了一个布尔数组来存储是否在字典里，更精细的地方在代码里一一叙述；

btw,数组记得置-1！

#include<iostream>      //cin,cout必须调用iostream库
#include<cstring>       //memset必须调用cstring库
using namespace std;
int a[101];
bool book[1001];
int main()
{
    memset(a,-1,sizeof(a));//注意，这里只是置了一个绝对值很大的负数，并不是-1
    memset(book,false,sizeof(book));
    int n,m,sum=0,t,b;//n是内存，m是单词个数，t相当于一个标记指针，sum是查单词的次数
    cin>>n>>m;
    t=1;//t的作用是指现在替换的是第几位的单词
    for(int i=1;i<=m;i++)
    {
        cin>>b;
        if(book[b]==false)//若b不在词典里
        {
            sum++;//需要查的次数++
            book[a[t]]=false;//将被覆盖的置false，这里注意，a[t]可能为负，有的编译器会报错，这里偷个懒(/▽＼)
            book[b]=true;//b已经在词典里了
            a[t]=b;
            if(t==n)//词典又一次移到最右，再从左边开始
                t-=n;
            t++;
        }
    }
    cout<<sum<<endl;
    return 0;
}