题目:
请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。
实现 LRUCache
类:
LRUCache(int capacity)
以 正整数 作为容量capacity
初始化 LRU 缓存int get(int key)
如果关键字key
存在于缓存中,则返回关键字的值,否则返回-1
。void put(int key, int value)
如果关键字key
已经存在,则变更其数据值value
;如果不存在,则向缓存中插入该组key-value
。如果插入操作导致关键字数量超过capacity
,则应该 逐出 最久未使用的关键字。
函数 get
和 put
必须以 O(1)
的平均时间复杂度运行。
解法一(哈希表):
题目指出函数get和put必须以O(1)的平均复杂度运行,而哈希表的查找,删除,复制等操作时间复杂度均为O(1),为此,我们采用纯哈希表数据结构来保证时间对关键字以及其数据值的查找,添加,等操作的时间复杂度均为O(1)。我们定义三个哈希表,分别为关键字到数据值的键值对,权重到关键字的键值对以及关键字到权重的键值对,每次对关键字的添加、访问、超容量时删除均会将权重增加1,以记录关键字的访问前后顺序(权重越小的表示关键字历史访问过的时间越久)。利用指针移动的思想(时间复杂度为O(1)),查找到权重最小的哈希表关键字,并将其删除,如下为笔者实现代码:
class LRUCache {
public:
// hashTabel1保存键值对
unordered_map<int,int> hashTable1;
// 建立,权重到关键字的键值对
unordered_map<int,int> hashTable2;
// 建立,关键字到权重的键值对
unordered_map<int,int> hashTable3;
int i =1;
int j =1;
int sum;
LRUCache(int capacity) {
sum =capacity;
}
int get(int key) {
auto it = hashTable1.find(key);
int result = -1;
if(it!=hashTable1.end()){
result = it->second;
auto it3 = hashTable3.find(key);
int kyk = it3->second;
hashTable2.erase(kyk);
hashTable2[i]=key;
hashTable3[key] = i;
i++;
return result;
}
return result;
}
void put(int key, int value) {
int length = hashTable1.size();
auto it = hashTable1.find(key);
if(it!=hashTable1.end()){
hashTable1[key]=value;
auto it3 = hashTable3.find(key);
int kyk = it3->second;
hashTable2.erase(kyk);
hashTable2[i] = key;
hashTable3[key] = i;
i++;
}
else{
if(length<sum){
hashTable1[key]=value;
hashTable2[i] = key;
hashTable3[key] = i;
i++;
}
else{
auto it = hashTable2.find(j);
while(it==hashTable2.end()){
j++;
it = hashTable2.find(j);
}
it = hashTable2.find(j);
// 要删除的元素的键
int del = it->second;
// 要删除的元素的权重
int weight = it->first;
hashTable3.erase(del);
hashTable2.erase(weight);
hashTable1.erase(del);
hashTable1[key]=value;
hashTable2[i] = key;
hashTable3[key] = i;
i++;
}
}
}
};
解法二(哈希表+双向链表):
LRU 缓存机制可以通过哈希表辅以双向链表实现,我们用一个哈希表和一个双向链表维护所有在缓存中的键值对。
1、双向链表按照被使用的顺序存储了这些键值对,靠近头部的键值对是最近使用的,而靠近尾部的键值对是最久未使用的。
2、哈希表即为普通的哈希映射,通过缓存数据的健映射到其在双向链表中的位置。
这样以来,我们首先使用哈希表进行定位,找出缓存项在双向链表中的位置,随后将其移动到双向链表的头部,即可在O(1)的时间内完成get或者put操作。
对于get操作,首先判断key是否存在:
1、如果key不存在,则返回-1;
2、如果key存在,则key对应的节点是最近被使用的节点。通过哈希表定位到该节点在双向链表中的位置,并将其移动到双向链表的头部,最后返回该节点的值。
对于put操作,首先判断key是否存在:
1、如果key不存在,使用key和vaule创建一个新的节点,在双向链表的头部添加该节点,并将key和该节点添加进哈希表中。然后判断双向链表的节点数量是否超出容量,如果超出容量,则删除双向链表的尾部节点,并删除哈希表中对应的项;
2、如果key存在,则与get操作类似,先通过哈希表定位,再将对应的节点的值更新为value,并将该节点移动到双向链表的头部。
上述各项操作中,访问哈希表的时间复杂度为O(1),在双向链表的头部添加节点、在双向链表的尾部删除节点的复杂度也为O(1)。而将一个节点移动到双向链表的头部,可以分成【删除该节点】和【在双向链表的头部添加节点】两部操作,都可以在O(1)时间内完成。
【在双向链表的实现中,使用一个伪头部和伪尾部标记界线,这样在添加节点和删除节点的时候就不需要检查相邻的节点是否存在。】如下为实现代码:
struct DLinkedNode {
int key, value;
DLinkedNode* prev;
DLinkedNode* next;
DLinkedNode(): key(0), value(0), prev(nullptr), next(nullptr) {}
DLinkedNode(int _key, int _value): key(_key), value(_value), prev(nullptr), next(nullptr) {}
};
class LRUCache {
private:
unordered_map<int, DLinkedNode*> cache;
DLinkedNode* head;
DLinkedNode* tail;
int size;
int capacity;
public:
LRUCache(int _capacity): capacity(_capacity), size(0) {
// 使用伪头部和伪尾部节点
head = new DLinkedNode();
tail = new DLinkedNode();
head->next = tail;
tail->prev = head;
}
int get(int key) {
if (!cache.count(key)) {
return -1;
}
// 如果 key 存在,先通过哈希表定位,再移到头部
DLinkedNode* node = cache[key];
moveToHead(node);
return node->value;
}
void put(int key, int value) {
if (!cache.count(key)) {
// 如果 key 不存在,创建一个新的节点
DLinkedNode* node = new DLinkedNode(key, value);
// 添加进哈希表
cache[key] = node;
// 添加至双向链表的头部
addToHead(node);
++size;
if (size > capacity) {
// 如果超出容量,删除双向链表的尾部节点
DLinkedNode* removed = removeTail();
// 删除哈希表中对应的项
cache.erase(removed->key);
// 防止内存泄漏
delete removed;
--size;
}
}
else {
// 如果 key 存在,先通过哈希表定位,再修改 value,并移到头部
DLinkedNode* node = cache[key];
node->value = value;
moveToHead(node);
}
}
void addToHead(DLinkedNode* node) {
node->prev = head;
node->next = head->next;
head->next->prev = node;
head->next = node;
}
void removeNode(DLinkedNode* node) {
node->prev->next = node->next;
node->next->prev = node->prev;
}
void moveToHead(DLinkedNode* node) {
removeNode(node);
addToHead(node);
}
DLinkedNode* removeTail() {
DLinkedNode* node = tail->prev;
removeNode(node);
return node;
}
};
时间复杂度:对于 put
和 get
都是 O(1)。空间复杂度:O(capacity),因为哈希表和双向链表最多存储 capacity+1 个元素。
笔者小记:
1、在C++中,当需要使用有先后顺序的哈希表时(即有序哈希表),可以采用哈希表+双向链表的方式实现,原本C++中并不支持有序哈希表的数据结构。
2、将一个节点移动到双向链表的头部,可以分成【删除该节点】和【在双向链表的头部添加节点】两部操作,都可以在O(1)时间内完成。
3、在双向链表的实现中,使用一个伪头部和伪尾部标记界线,这样在添加节点和删除节点的时候就不需要检查相邻的节点是否存在。