Java面试黄金宝典24

ylfhpy

已于 2025-03-30 10:11:19 修改

阅读量526

点赞数 21

分类专栏： Java面试黄金宝典文章标签： java 面试开发语言算法面经职场和发展

于 2025-03-30 10:07:46 首次发布

本文链接：https://blog.youkuaiyun.com/ylfhpy/article/details/146721323

版权

Java面试黄金宝典专栏收录该内容

30 篇文章

订阅专栏

1. 什么是跳表

定义

跳表（Skip List）是一种随机化的数据结构，它基于有序链表发展而来，通过在每个节点中维护多个指向其他节点的指针，以多层链表的形式组织数据。其核心思想是在链表基础上增加额外层次，每个层次都是一个有序链表，且高层链表是底层链表的子集，从而能在 O(logn) 的平均时间复杂度内完成插入、删除和查找操作。

要点

随机层次：每个节点的层次随机确定，通常采用抛硬币等概率方式决定节点是否拥有更高层次。
多层链表结构：由多个层次的有序链表构成，高层链表可帮助快速定位目标节点大致位置。
操作方式：查找、插入和删除操作从最高层开始，依据节点指针移动，直至找到目标节点或确定其不存在。

代码示例

java

import java.util.Random;

class Node {
    int value;
    Node[] forward;

    public Node(int value, int level) {
        this.value = value;
        this.forward = new Node[level + 1];
    }
}

class SkipList {
    private static final int MAX_LEVEL = 16;
    private final float probability = 0.5f;
    private int level;
    private Node head;
    private Random random;

    public SkipList() {
        this.level = 0;
        this.head = new Node(-1, MAX_LEVEL);
        this.random = new Random();
    }

    private int randomLevel() {
        int lvl = 0;
        while (random.nextFloat() < probability && lvl < MAX_LEVEL) {
            lvl++;
        }
        return lvl;
    }

    public void insert(int value) {
        Node[] update = new Node[MAX_LEVEL + 1];
        Node current = head;

        for (int i = level; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value < value) {
                current = current.forward[i];
            }
            update[i] = current;
        }

        current = current.forward[0];

        if (current == null || current.value != value) {
            int newLevel = randomLevel();

            if (newLevel > level) {
                for (int i = level + 1; i <= newLevel; i++) {
                    update[i] = head;
                }
                level = newLevel;
            }

            Node newNode = new Node(value, newLevel);

            for (int i = 0; i <= newLevel; i++) {
                newNode.forward[i] = update[i].forward[i];
                update[i].forward[i] = newNode;
            }
        }
    }

    public boolean search(int value) {
        Node current = head;
        for (int i = level; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value < value) {
                current = current.forward[i];
            }
        }
        current = current.forward[0];
        return current != null && current.value == value;
    }

    public void delete(int value) {
        Node[] update = new Node[MAX_LEVEL + 1];
        Node current = head;

        for (int i = level; i >= 0; i--) {
            while (current.forward[i] != null && current.forward[i].value < value) {
                current = current.forward[i];
            }
            update[i] = current;
        }

        current = current.forward[0];

        if (current != null && current.value == value) {
            for (int i = 0; i <= level; i++) {
                if (update[i].forward[i] != current) {
                    break;
                }
                update[i].forward[i] = current.forward[i];
            }

            while (level > 0 && head.forward[level] == null) {
                level--;
            }
        }
    }
}

应用

数据库索引：在数据库中作为索引结构，能有效提高数据的查找效率，加速查询操作。
缓存系统：用于快速查找和更新缓存数据，提升缓存系统的响应速度。
分布式系统：在分布式系统中，可用于维护有序的数据结构，方便数据的管理和查找。

2. 给定 n 个左括号以及 n 个右括号，打印出所有合法的括号组合

定义

此问题可运用回溯法解决。回溯法是一种通过尝试所有可能的组合来找出问题解的算法。在生成括号组合的过程中，需要保证在任何位置，左括号的数量都不小于右括号的数量，并且最终左括号和右括号的数量都等于 n，以此确保组合的合法性。

要点

递归生成组合：借助递归函数，持续尝试添加左括号或右括号，逐步构建括号组合。
合法性检查：在添加括号时，实时检查左括号和右括号的数量是否满足合法性条件。

代码示例

java

import java.util.ArrayList;
import java.util.List;

public class GenerateParentheses {
    public List<String> generateParenthesis(int n) {
        List<String> result = new ArrayList<>();
        backtrack(result, "", 0, 0, n);
        return result;
    }

    private void backtrack(List<String> result, String current, int open, int close, int max) {
        if (current.length() == max * 2) {
            result.add(current);
            return;
        }

        if (open < max) {
            backtrack(result, current + "(", open + 1, close, max);
        }
        if (close < open) {
            backtrack(result, current + ")", open, close + 1, max);
        }
    }

    public static void main(String[] args) {
        GenerateParentheses gp = new GenerateParentheses();
        List<String> combinations = gp.generateParenthesis(3);
        for (String combination : combinations) {
            System.out.println(combination);
        }
    }
}

应用

语法分析：在编译器中，用于生成合法的括号表达式，辅助进行代码的语法解析。
组合数学：在组合数学领域，用于解决与括号组合相关的问题，如计算合法括号组合的数量等。
编程竞赛：常作为编程竞赛中的题目，考察选手的算法设计和实现能力。

3. 给定四个点如何判断是否为矩形

定义

判断四个点是否构成矩形，可通过计算四个点两两之间的距离，得到 6 个距离值。依据矩形的性质，矩形有两组相等的对边和两条相等的对角线，并且满足勾股定理。因此，将这 6 个距离值排序后，前四个值应相等，后两个值也应相等，同时前四个值的平方和等于后两个值的平方和。

要点

距离计算：运用两点间距离公式，准确计算任意两点之间的距离。
排序和比较：对计算所得的距离值进行排序，然后对比对边和对角线的长度是否符合矩形的性质。

代码示例

java

class Point {
    int x, y;
    Point(int x, int y) {
        this.x = x;
        this.y = y;
    }
}

public class IsRectangle {
    public boolean isRectangle(Point p1, Point p2, Point p3, Point p4) {
        double[] distances = new double[6];
        int index = 0;
        distances[index++] = distance(p1, p2);
        distances[index++] = distance(p1, p3);
        distances[index++] = distance(p1, p4);
        distances[index++] = distance(p2, p3);
        distances[index++] = distance(p2, p4);
        distances[index] = distance(p3, p4);

        java.util.Arrays.sort(distances);

        return distances[0] > 0 &&
                distances[0] == distances[1] &&
                distances[1] == distances[2] &&
                distances[2] == distances[3] &&
                distances[4] == distances[5] &&
                2 * distances[0] * distances[0] == distances[4] * distances[4];
    }

    private double distance(Point p1, Point p2) {
        return Math.sqrt((p1.x - p2.x) * (p1.x - p2.x) + (p1.y - p2.y) * (p1.y - p2.y));
    }

    public static void main(String[] args) {
        Point p1 = new Point(0, 0);
        Point p2 = new Point(0, 1);
        Point p3 = new Point(1, 1);
        Point p4 = new Point(1, 0);
        IsRectangle ir = new IsRectangle();
        System.out.println(ir.isRectangle(p1, p2, p3, p4));
    }
}

应用

图形识别：在计算机图形学中，用于识别图像中的矩形区域，辅助进行图像分析和处理。
几何计算：在几何计算相关的应用中，判断给定的四个点是否构成矩形，为后续的几何分析提供基础。
游戏开发：在游戏开发中，可用于检测游戏元素的碰撞边界是否为矩形，实现碰撞检测等功能。

4. 海量 URL 数据，低内存情况下如何找重复次数最高的那一个

定义

此问题可采用分治和哈希表的方法解决。由于内存有限，无法一次性将所有 URL 数据加载到内存中，所以将海量的 URL 数据按照哈希函数进行划分，存储到多个小文件中，使每个小文件的数据量能被加载到内存。接着对每个小文件中的 URL 进行统计，利用哈希表记录每个 URL 的出现次数，找出每个小文件中出现次数最多的 URL。最后比较所有小文件中出现次数最多的 URL，得到最终出现次数最多的 URL。

要点

分治策略：将海量数据划分为多个小文件，降低内存压力，便于处理。
哈希表统计：在每个小文件中使用哈希表统计 URL 的出现次数，高效记录数据信息。
合并结果：对比所有小文件中出现次数最多的 URL，得出最终结果。

应用

网络日志分析：在分析网络日志时，找出访问次数最多的 URL，了解用户的访问偏好和网站的热门内容。
搜索引擎优化：在搜索引擎优化工作中，分析用户访问的热门 URL，为网站的优化和推广提供依据。
流量监控：对网络流量中的 URL 进行统计，找出流量集中的 URL，进行针对性的流量管理和优化。

5. 10 亿个数，如何求 100 个最大的

定义

可以利用最小堆来解决该问题。最小堆是一种完全二叉树，其每个节点的值都小于或等于其子节点的值。首先从 10 亿个数中取出前 100 个数构建一个最小堆，然后遍历剩下的数，对于每个数，若它大于堆顶元素，则将堆顶元素替换为该数，并调整堆，使其依旧满足最小堆的性质。最终，堆中的 100 个数即为 10 亿个数中最大的 100 个数。

要点

最小堆构建：使用前 100 个数构建最小堆，为后续筛选做准备。
堆调整：在遍历剩余数的过程中，不断调整堆，保证堆始终保持最小堆的性质。

代码示例

java

import java.util.PriorityQueue;

public class FindTop100 {
    public static int[] findTop100(int[] nums) {
        PriorityQueue<Integer> minHeap = new PriorityQueue<>(100);
        for (int i = 0; i < 100; i++) {
            minHeap.offer(nums[i]);
        }
        for (int i = 100; i < nums.length; i++) {
            if (nums[i] > minHeap.peek()) {
                minHeap.poll();
                minHeap.offer(nums[i]);
            }
        }
        int[] result = new int[100];
        for (int i = 99; i >= 0; i--) {
            result[i] = minHeap.poll();
        }
        return result;
    }

    public static void main(String[] args) {
        int[] nums = new int[1000000000];
        // 初始化 nums 数组
        int[] top100 = findTop100(nums);
        for (int num : top100) {
            System.out.println(num);
        }
    }
}

应用

数据筛选：在大数据处理场景中，筛选出数据中的前 k 个最大值，用于数据分析和决策。
排行榜系统：在各类排行榜系统中，找出排名前 k 的数据，如游戏排行榜、销售排行榜等。
资源分配：根据数据的大小进行资源分配，优先分配给排名靠前的数据。

6. 如何实现大文件排序

定义

大文件排序可采用外部排序的方法。当数据量极大，无法一次性将所有数据加载到内存中进行排序时，外部排序将大文件分割成多个小文件，每个小文件能被加载到内存中进行内部排序（如快速排序、归并排序等），之后将这些有序的小文件进行归并，得到最终的有序大文件。

要点

文件分割：依据内存大小，将大文件合理分割成多个小文件。
内部排序：对每个小文件进行内部排序，得到有序的小文件。
归并操作：将有序的小文件进行归并，生成最终的有序大文件。

应用

数据库排序：在数据库中，对大量数据进行排序时，外部排序是常用的方法，确保数据的有序存储和查询。
日志文件处理：在处理大量日志文件时，需要对日志文件进行排序，便于后续的日志分析和问题排查。
大数据存储：在大数据存储系统中，对数据文件进行排序，提高数据的检索效率。

7. 给定三个大于 10G 的文件（每行一个数字）和 100M 内存的主机，如何找到在三个文件都出现且次数最多的 10 个字符串

定义

此问题可采用分治和哈希的思想解决。由于内存有限，无法一次性将三个文件的数据加载到内存中，所以将每个文件按照哈希函数进行划分，存储到多个小文件中，使每个小文件的数据量能被加载到内存。对于每个小文件，使用哈希表统计每个数字的出现次数，并记录在三个文件中都出现的数字及其出现次数。最后将所有小文件的统计结果进行合并，找出在三个文件中都出现且次数最多的 10 个数字。

要点

文件划分：使用哈希函数将大文件划分为多个小文件，降低内存使用。
哈希表统计：在每个小文件中使用哈希表统计数字的出现次数，记录有效信息。
合并结果：整合所有小文件的统计结果，找出最终结果。

应用

数据挖掘：在数据挖掘过程中，分析多个数据源中共同出现且频率较高的数据，发现数据之间的关联和规律。
日志分析：在日志分析中，找出多个日志文件中共同出现且频率较高的事件，用于故障排查和系统监控。
信息检索：在信息检索系统中，统计多个文档中共同出现的关键词，提高检索的准确性和效率。

8. 如何求两个 int 数组的并集、交集

定义

交集：使用哈希表实现。先将一个数组中的元素存入哈希表，再遍历另一个数组，检查每个元素是否在哈希表中，若存在则将其加入交集中。
并集：把两个数组的元素都存入哈希表，然后遍历哈希表，将所有元素加入并集中，同时注意去重。

要点

哈希表使用：借助哈希表的快速查找特性，提高交集和并集的计算效率。
去重处理：在计算并集时，确保结果中不包含重复元素。

代码示例

java

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class ArrayIntersectionUnion {
    public List<Integer> intersection(int[] nums1, int[] nums2) {
        Map<Integer, Integer> map = new HashMap<>();
        List<Integer> result = new ArrayList<>();
        for (int num : nums1) {
            map.put(num, map.getOrDefault(num, 0) + 1);
        }
        for (int num : nums2) {
            if (map.containsKey(num) && map.get(num) > 0) {
                result.add(num);
                map.put(num, map.get(num) - 1);
            }
        }
        return result;
    }

    public List<Integer> union(int[] nums1, int[] nums2) {
        Map<Integer, Integer> map = new HashMap<>();
        List<Integer> result = new ArrayList<>();
        for (int num : nums1) {
            map.put(num, 1);
        }
        for (int num : nums2) {
            map.put(num, 1);
        }
        for (int num : map.keySet()) {
            result.add(num);
        }
        return result;
    }

    public static void main(String[] args) {
        int[] nums1 = {1, 2, 2, 3};
        int[] nums2 = {2, 2, 4};
        ArrayIntersectionUnion ai = new ArrayIntersectionUnion();
        List<Integer> intersection = ai.intersection(nums1, nums2);
        List<Integer> union = ai.union(nums1, nums2);
        System.out.println("Intersection: " + intersection);
        System.out.println("Union: " + union);
    }
}

应用

数据处理：在数据处理过程中，经常需要计算两个数据集的交集和并集，用于数据筛选和整合。
数据库查询：在数据库查询中，使用交集和并集操作来筛选数据，满足不同的查询需求。
集合运算：在数学和计算机科学的集合运算中，交集和并集是基本的运算操作。

9. 如何实现 1T query 统计前 k 个热门的

定义

可采用分治、哈希和堆的思想解决该问题。由于数据量巨大，无法一次性将所有 query 数据加载到内存中，所以将 1T 的 query 数据按照哈希函数进行划分，存储到多个小文件中，使每个小文件的数据量能被加载到内存。对于每个小文件，使用哈希表统计每个 query 的出现次数，然后使用最小堆筛选出出现次数最多的 k 个 query。最后将所有小文件的筛选结果进行合并，再次使用最小堆筛选出最终的前 k 个热门 query。

要点

分治策略：将海量数据划分为多个小文件，减轻内存负担。
哈希表统计：在每个小文件中使用哈希表统计 query 的出现次数，记录数据频率。
最小堆筛选：利用最小堆筛选出出现次数最多的 k 个 query，高效获取热门数据。

应用

搜索引擎：在搜索引擎中，统计用户搜索的热门关键词，为搜索结果的排序和推荐提供依据。
电商平台：在电商平台中，统计热门商品的搜索次数，用于商品推荐和营销活动策划。
社交媒体：在社交媒体平台中，统计热门话题和趋势，帮助用户发现热点内容。

10. 对 10G 个数进行排序，限制内存为 1G 大数问题，但是这 10G 个数可能是整数，字符串以及中文，如何排序

定义

采用外部排序和多阶段处理的方法。首先根据数据的类型（整数、字符串、中文）将 10G 数据进行分类，分别存储到不同的文件中。然后对于每个类型的数据文件，将其分割成多个小文件，使每个小文件能被加载到内存中进行排序。对于整数可使用快速排序、归并排序等算法；对于字符串和中文，可使用字典序排序。接着将每个类型的有序小文件进行归并，得到每个类型的有序大文件。最后将不同类型的有序大文件按照一定规则（如先整数，再字符串，最后中文）进行合并，得到最终的有序文件。