问题描述
给你一个长度为 n 的字符串数组 names 。你将会在文件系统中创建 n 个文件夹:在第 i 分钟,新建名为 names[i] 的文件夹。
由于两个文件 不能 共享相同的文件名,因此如果新建文件夹使用的文件名已经被占用,系统会以 (k) 的形式为新文件夹的文件名添加后缀,其中 k 是能保证文件名唯一的 最小正整数 。
返回长度为 n 的字符串数组,其中 ans[i] 是创建第 i 个文件夹时系统分配给该文件夹的实际名称。
原题链接
https://leetcode-cn.com/problems/making-file-names-unique
样例
解题思路
我感觉这道题主要是在查找方面会耗时大,一般遍历会经历多轮循环,时间复杂度肯定不能达到要求。
尝试一:
我用map来保存便于快速查找元素。
发现基于红黑树的map查找速度O(nlogn)依旧不合要求。
尝试二:
用hash表来存。
c++STL中hash表类型是unordered_map,hash表是基于哈希函数直接映射,没有冲突的话可以达到O(1)的查询效率。
尝试之后没想到还需要再优化。
尝试二改进:
后缀(k)可以默认都从(1)开始。
但是如果已经有(1)、(2)…(n)在hash表中了,那岂不是要多遍历这么多遍。所以,定义k的起点很有意义,而不是一股脑儿的从(1)开始。
int k = mp.find(names[i])->second + 1;
hash表存的键值对是:
- key -> 文件名
- value -> 该文件名在原始数组中出现的次数
举个例子:如果已经有3个同样的文件名filename,那么当出现第4个时,最少要从(3)开始添加后缀(而不需要从(1)开始)。
重点
既要把当前生成的文件名加入hash,
又要更新原始数组中出现的次数,
保证k可以直接取最优,优化查找时间。
以下是完整代码
// c++
class Solution {
public:
vector<string> getFolderNames(vector<string>& names) {
int len = names.size();
vector<string> v; // 用于保存结果
unordered_map<string, int> mp; // hash表
for (int i = 0; i < len; i++)
{
string s;
if (mp.find(names[i]) == mp.end())// 未出现该文件名
{
v.push_back(names[i]);
mp[names[i]] = 0; // 加入hash表
}else{
// 已经出现此文件名,需要加后缀
int k = mp.find(names[i])->second + 1; // k的起点是优化的重点
while(1)
{
s.clear();
s = names[i] + "(" + to_string(k) + ")";
if (mp.find(s) == mp.end())
{
v.push_back(s);
break;
}
k++;
}
// 既要把当前生成的文件名加入hash
// 又要更新原始数组中出现的次数,保证k可以直接取最优,优化查找时间
mp[s] = 0;
mp[names[i]] = k;
}
}
return v;
}
};
记录一下我的做题思路,给大家参考参考。