机器翻译(queue)

题目背景 小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。
题目描述 这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于每个英文单词,软件会先在内存中查找这个单词的中文含义,如果内存中有,软件就会用它进行翻译;如果内存中没有,软件就会在外存中的词典内查找,查出单词的中文含义然后翻译,并将这个单词和译义放入内存,以备后续的查找和翻译。
假设内存中有MMM个单元,每单元能存放一个单词和译义。每当软件将一个新单词存入内存前,如果当前内存中已存入的单词数不超过M−1M-1M−1,软件会将新单词存入一个未使用的内存单元;若内存中已存入MMM个单词,软件会清空最早进入内存的那个单词,腾出单元来,存放新单词。
假设一篇英语文章的长度为NNN个单词。给定这篇待译文章,翻译软件需要去外存查找多少次词典?假设在翻译开始前,内存中没有任何单词。
输入格式 共222行。每行中两个数之间用一个空格隔开。
第一行为两个正整数M,NM,NM,N,代表内存容量和文章的长度。
第二行为NNN个非负整数,按照文章的顺序,每个数(大小不超过100010001000)代表一个英文单词。文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。
输出格式 一个整数,为软件需要查词典的次数。
输入输出样例
输入 #1
3 7
1 2 1 5 4 4 1
输出 ``
5

#include<bits/stdc++.h>
using namespace std;
int main(){
    queue <int> q;
    int m,n,sum=0;
    bool a[10000];
    cin>>m>>n;
    for(int i=1;i<=n;i++)
    {
        int x;
        cin>>x;
        if(a[x])
            continue;
        else{
            if(q.size()>=m)
            {
                a[q.front()]=false;
                q.pop();
            }
            q.push(x);
            a[x]=true;
            sum++;
        }
    }
    cout<<sum<<endl;
    return 0;
}
<think>根据用户需求,用户希望查找NOIP2010提高组P1540机器翻译题目的题解或示例代码。题目描述:内存中有M个单元,每单元能存放一个单词。每次查找一个单词,若内存中有则无需访问外存;若没有则系统会查字典,然后将该单词存入内存。若内存已满,则删除最早进入内存的单词。求系统需要访问外存的次数。引用[2]中提供了一段C++代码,这正是该题的一个典型解法,使用队列模拟内存,用布尔数组标记单词是否在内存中。解题思路:1.初始化一个队列(模拟内存)和一个标记数组(记录单词是否在内存中)。2.对于每个输入的单词:-如果该单词已在内存中(标记为true),则跳过。-如果不在内存中:*访问外存次数加1;*如果内存已满(队列大小等于M),则弹出队首单词并将其标记为不在内存中;*将新单词加入队列并标记为在内存中。3.输出访问外存的总次数。引用[2]的代码实现:```cpp#include<iostream>#include<algorithm>#include<queue>usingnamespacestd;constintN=1010;intn,m;boolst[N];intmain(){cin>>m>>n;intres=0;queue<int>q;for(inti=0;i<n;i++){intx;cin>>x;if(!st[x]){res++;if(q.size()==m){st[q.front()]=false;q.pop();}q.push(x);st[x]=true;}}cout<<res<<endl;return0;}```代码说明:-`m`:内存容量-`n`:单词总数-`st`数组:标记单词是否在内存中(索引为单词值,题目中单词为整数)-`q`:队列,按顺序存储内存中的单词-`res`:记录访问外存的次数注意事项:1.题目中单词为整数(范围在0~1000),所以用数组标记可行。2.队列模拟了先进先出的淘汰策略。相关问题:1.如何分析该算法的时间复杂度?2.如果单词范围很大(例如10^9),如何优化标记方法?3.该问题与操作系统的页面置换算法有何关联?</think>### NOIP 2010 提高组 P1540 机器翻译题解 #### 题目分析 题目要求模拟内存管理过程:内存容量为 $M$,依次处理 $N$ 个单词请求。规则如下: 1. 若单词已在内存中,不操作 2. 若单词不在内存中: - 访问外存(计数+1) - 若内存已满,删除最早进入的单词 - 将新单词加入内存 本质是**先进先出(FIFO)队列**的模拟问题,需统计访问外存的总次数。 #### 核心算法 使用队列维护内存中的单词顺序,配合标记数组记录单词存在状态: ```cpp #include <iostream> #include <queue> using namespace std; const int MAX_WORD = 1000; // 单词值域[0,1000] int main() { int M, N; cin >> M >> N; // M=内存容量, N=请求总数 queue<int> memQueue; // 内存队列(按进入顺序) bool inMem[MAX_WORD]{}; // 标记数组,inMem[x]=true表示x在内存 int count = 0; // 外存访问计数 for (int i = 0; i < N; i++) { int word; cin >> word; if (!inMem[word]) { // 单词不在内存 count++; if (memQueue.size() >= M) { // 内存已满 int oldest = memQueue.front(); memQueue.pop(); inMem[oldest] = false; // 移除最早单词 } memQueue.push(word); inMem[word] = true; // 添加新单词 } } cout << count << endl; return 0; } ``` #### 关键点说明 1. **时间复杂度**:$O(N)$,每个单词处理时间为 $O(1)$ 2. **空间复杂度**:$O(M + K)$($K$ 为单词值域大小) 3. **队列作用**:维护单词进入顺序,实现FIFO淘汰 4. **标记数组**:$O(1)$ 时间判断单词存在性 5. **边界处理**:当 $M=0$ 时所有请求都需要访问外存 #### 算法优化方向 1. **大值域场景**:若单词值域过大(如 $10^9$),可用 `unordered_set` 替代标记数组 2. **动态内存**:使用循环队列避免STL队列的动态内存分配 3. **预分配队列**:初始化队列容量为 $M$ 减少扩容开销 #### 示例测试 输入: ``` 3 7 1 2 3 4 1 2 5 ``` 处理过程: 1. 1,2,3 加入内存(访问外存3次) 2. 4 加入时淘汰1(访问+1,内存:2,3,4) 3. 1 不在内存,加入时淘汰2(访问+1,内存:3,4,1) 4. 2 不在内存,加入时淘汰3(访问+1,内存:4,1,2) 5. 5 不在内存,加入时淘汰4(访问+1) 输出: ``` 6 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值