题目地址(440. 字典序的第K小数字)
https://leetcode-cn.com/problems/k-th-smallest-in-lexicographical-order/
题目描述
给定整数 n 和 k,返回 [1, n] 中字典序第 k 小的数字。
示例 1:
输入: n = 13, k = 2
输出: 10
解释: 字典序的排列是 [1, 10, 11, 12, 13, 2, 3, 4, 5, 6, 7, 8, 9],所以第二小的数字是 10。
示例 2:
输入: n = 1, k = 1
输出: 1
提示:
1 <= k <= n <= 109
前置知识
字典序
先序遍历
思路
直观想法:将1 - n的数字转换为字符串,排序找到第k小的数字,但数据范围过大,时间复杂度过高。
利用字典树的特性将所有小于等于 n 的数字按照字典序的方式进行重建,可以得到如下:
前序遍历该字典树即可得到字典序从小到大的数字序列,遍历到第 k 个节点即为第 k 小的数字,因此构建该字典树后先序遍历,便可得到结果,时间复杂度为O(k)O(k)O(k), 时间复杂度仍然过高。原因就是先序遍历是一个一个都走到,因此可以在遍历时加一些优化,使得遍历的节点少一些。
优化的思路就是不必一个一个向下访问到每个叶节点,而是尽量在父节点就做出判断。
在字典树的先序遍历中,发现当访问到curcurcur节点时,可以判断第kkk个数是否在当前以curcurcur节点为根的子树中。如果第k个数在子树中,在向下遍历,否则向右遍历,去查找第k−以cur节点为子树的大小k - 以cur节点为子树的大小k−以cur节点为子树的大小的数,这样可以跳过以curcurcur节点为根的子树不用访问。

那么如何判断第kkk个数是否在以curcurcur节点为根的子树?
这里按照层序遍历的思想,当前的前缀为curcurcur, 下一种前缀为cur+1cur + 1cur+1,记为nextnextnext;
两个节点分别向下扩展,由于是十叉树,所以下一节点cur′=cur∗10cur' = cur * 10cur′=cur∗10, next′=next∗10next' = next * 10next′=next∗10
next′−cur′next' - cur'next′−cur′就能够得到cur′cur'cur′这一层的所有节点;在保证小于等于nnn的前提不断向下遍历,统计出每层的节点数。在最后一层的时候,为了保证小于等于nnn,该层的有效范围的右端点为nnn; 所以每层的最右侧节点应该为 min(next−1,n)min(next - 1, n)min(next−1,n)
统计出所有小于等于n的以curcurcur为根的子树的节点个数和sum(cur)sum(cur)sum(cur),和kkk作比较
- 如果满足sum(cur)>=ksum(cur) >= ksum(cur)>=k, 说明,则此时可以肯定第 k小的节点一定在curcurcur为根构成的子树中,则此时需要在cur的孩子节点中依次进行查找。减去cur根节点,向下遍历。
- 如果满足sum(cur)<ksum(cur) < ksum(cur)<k, 说明,则此时可以肯定第 k小的节点一定不在curcurcur为根构成的子树中,则从下一种前缀next开始,查找第k−sum(cur)个节点k - sum(cur) 个节点k−sum(cur)个节点
代码
- 语言支持:C++
C++ Code:
class Solution {
public:
int nodeCount(long long cur, int n) // 统计以cur为根的在合法范围的子树的大小
{
long long next = cur + 1;
int res = 0;
while(cur <= n) // 统计每层的节点
{
res += min(next - cur, n - cur + 1); // 每层节点的右边界为min(n, next)
cur *= 10;
next *= 10;
}
return res; // cur为根的子树的节点数目总和
}
int findKthNumber(int n, int k) {
int cur = 1;
while(k > 1)
{
if(nodeCount(cur, n) >= k) // cur为根的子树的节点数目总和 >= k
{
k --; // 去掉cur节点
cur *= 10; // 向下搜寻
}
else
{
k -= nodeCount(cur, n); // 去掉cur为根的子树的节点数目总和
cur ++; // 遍历下一种前缀
}
}
return cur;
}
};
复杂度分析
令 n 为数组长度。
- 时间复杂度:O(log(N))O(log(N))O(log(N))
- 空间复杂度:O(1)O(1)O(1)

该博客介绍了如何解决寻找[1,n]区间内字典序第k小数字的问题。通过构建十叉字典树并优化先序遍历策略,实现了O(logN)的时间复杂度。主要思路是利用层序遍历思想,统计每个前缀的节点数量,判断第k个数字是否在当前子树中,从而避免不必要的遍历。
361

被折叠的 条评论
为什么被折叠?



