- 博客(880)
- 收藏
- 关注
原创 每日面试题-什么是向量数据库?在基于大模型的应用开发中,向量数据库主要解决什么问题?
是专门用于存储、索引和检索高维向量数据的数据库系统。其核心能力是通过高效的相似性搜索算法(如余弦相似度),快速找到与查询向量最接近的数据项。向量数据库已成为大模型应用的基座组件,据行业统计,采用向量检索可使生成内容的事实准确性提升40-65%,同时降低70%以上的幻觉发生率。
2025-04-02 07:56:00
309
原创 请解释大模型微调(Fine-tuning)的原理,并说明在什么业务场景下需要微调而不是直接使用基础模型?
相比直接使用基础模型,微调可使任务特定指标平均提升40-70%,同时降低幻觉率约60%。但需平衡训练成本(典型微调需要8-32块GPU小时)与收益,对于快速迭代场景可考虑LoRA等参数高效微调方法。大模型微调(Fine-tuning)的原理是通过在预训练的基础模型上进行针对性训练,使其适应特定任务或领域需求的技术过程。:模型通过海量通用数据(如互联网文本)学习语言模式、世界知识和基础推理能力,形成通用表征能力。标注数据规模≥1,000条(分类任务)或10,000 tokens(生成任务)
2025-04-02 07:54:19
211
原创 如何在 JMeter 中测试 JSON 数据格式的接口?
右键HTTP Request → Add → Config Element → HTTP Header Manager。完整测试计划应包含:HTTP请求→参数化→断言→结果收集四个核心模块,建议使用Template功能保存常用配置。右键Test Plan → Add → Threads (Users) → Thread Group。右键Thread Group → Add → Sampler → HTTP Request。在HTTP Request的Body Data区域编写JSON报文。
2025-04-01 17:58:47
882
原创 Agent是什么?
实时感知环境变化(如数据输入、用户指令、系统状态等),动态调整策略。高级Agent可通过逻辑推理、机器学习(如强化学习)提升决策效率。围绕预设目标(如完成用户任务、优化系统性能)驱动行为。是计算机科学和人工智能领域中一个核心概念,指能够。无需持续人工干预,可独立运行并管理自身行为。以实现特定目标的实体或程序。
2025-04-01 17:51:59
258
原创 hashmap底层是怎么实现的,怎么扩容的,为什么要引入负载因子这个东西
该设计通过动态扩容机制和负载因子的协同作用,在时间复杂度、空间利用率和实际工程效率之间实现了最佳平衡,使得HashMap成为最高效的键值对容器之一。三、负载因子(Load Factor)的设计意义。一、底层数据结构(以Java 8为例)
2025-03-31 14:08:32
420
原创 每日算法题-三维地形最短路径
给定N×N×N的三维矩阵表示地形高度,计算从原点(0,0,0)到终点(N-1,N-1,N-1)的最小体力消耗路径。每次移动允许6个方向(上下左右前后),体力消耗为高度差的绝对值。输入:[[[1,2],[3,4]], [[5,6],[7,8]]]:三维数组height[N][N][N] (1≤N≤50):时间复杂度需低于O(N^4)
2025-03-30 16:41:18
155
原创 每日面试题-JDBC架构设计与驱动类型对比
请阐述JDBC四层架构设计(Java应用程序-JDBC API-JDBC Manager-JDBC Driver)的核心作用。
2025-03-30 16:17:20
181
原创 表单提交时,<form>标签的action和method属性的作用是什么?
【代码】表单提交时,<form>标签的action和method属性的作用是什么?
2025-03-29 14:51:39
268
原创 当指定<font face=“楷体“>时,可能出现什么显示问题?给出两种解决方案
问题层级具体表现技术本质客户端依赖字体未安装时显示异常HTML字体渲染机制基于本地环境跨平台差异各系统字体命名不统一操作系统字体库管理差异建议优先采用CSS字体栈方案,平衡视觉效果与兼容性要求。
2025-03-29 14:41:59
163
原创 写出HTML文档的基本结构,并说明<head>和<body>的作用
承载的是"文档本身的内容"。内容不直接显示(除标题外),而。定义的是"关于文档的信息",
2025-03-29 14:04:26
438
原创 每日算法题-结队编程
该方法的时间复杂度为 O(n²),能够高效处理最大规模为 1000 的输入。名员工,每个员工有独一无二的职级,每三个员工形成一个小组进行结队编程。请你按上述条件计算可能组合的小组数量。同一员工可以参加多个小组。某部门计划通过结队编程来进行项目开发,已知该部门有。第二行输入:按序号依次排列的员工的职级。名员工,他们的职级分别为。从部门中选出序号分别为。第一行输入:员工总数。
2025-03-29 10:46:53
265
原创 每日面试题-监督学习、半监督学习和无监督学习分别是什么,它们的区别在哪?
监督学习、半监督学习和无监督学习是机器学习的三种主要范式,它们在数据使用方式、任务目标和应用场景上存在显著差异。
2025-03-29 10:43:21
373
原创 每日算法题-API 集群负载统计
某个产品的 RESTful API 集合部署在服务器集群的多个节点上,近期对客户端访问日志进行了采集,需要统计各个 API 的访问频次,根据热点信息在服务器节点之间做负载均衡,现在需要实现热点信息统计查询功能。RESTful API 的由多个层级构成,层级之间使用连接,如/A/B/C/D这个地址,A属于第一级,B属于第二级,C属于第三级,D属于第四级。现在负载均衡模块需要知道给定层级上某个名字出现的频次,未出现过用0次表示,实现这个功能。第一行为N,表示访问历史日志的条数,0<N<=100。接下来N。
2025-03-27 07:47:31
223
原创 每日面试题-在 Spark SQL 中,如何定义和注册一个临时视图(Temporary View)?
【代码】每日面试题-在 Spark SQL 中,如何定义和注册一个临时视图(Temporary View)?
2025-03-27 07:27:59
226
原创 每日算法题-数据流中的中位数
是有序整数列表中的中间值。如果列表的大小是偶数,则没有中间值,中位数是两个中间值的平均值。3初始化对象。将数据流中的整数num添加到数据结构中。返回到目前为止所有元素的中位数。与实际答案相差10-5以内的答案将被接受。
2025-03-26 08:17:54
213
原创 每日面试题-什么是 Java 中的不可变类?
Java 中的不可变类(Immutable Class)是指其实例在创建后状态(属性值)无法被修改的类。这种类的设计遵循"创建即定型"原则,具有线程安全、可缓存、适合作为哈希键等特性。
2025-03-26 08:06:22
153
原创 每日算法题-将企鹅击落水中最小的力
的冰块上,现在通过打破一些冰块来使得企鹅掉落河中,然而他无法打破企鹅所踩的冰块。当两侧的冰块都没有与河两岸连接时,则冰块会掉落到河中。牛牛发明了一款破冰行动的游戏,假设在河面上,有。输出可以击落企鹅到水中的最小力。将一只企鹅放到任意一个标号为。第二行中,按顺序给出代表打破第。题目保证企鹅所在的地方用。每个冰块都有不同的强度。表示,没有企鹅位于冰块。
2025-03-25 07:41:13
419
原创 算法题-账户合并
给定一组账户,每个账户有一个名称和一组电子邮件地址。电子邮件地址可能会在多个账户中重复出现。如果两个账户有相同的电子邮件地址,则认为这两个账户属于同一用户。请将这些账户合并,并输出合并后的账户。
2025-03-24 08:05:24
281
原创 每日算法题-Nim 游戏 - 台阶
给定一个台阶数n,玩家每次可以选择跳跃 1 到m个台阶,最后一个台阶到达者获胜。假设两位玩家都采取最优策略,判断先手玩家是否会获胜。
2025-03-24 07:43:36
204
原创 每日面试题-假设有一个 1G 大的 HashMap,此时用户请求过来刚好触发它的扩容,会怎样?让你改造下 HashMap 的实现该怎样优化?
分片哈希 + 渐进式扩容(参考 Redis Cluster 设计)。:将大 Map 拆分为多个小 Map,降低单次扩容影响。时触发扩容(默认负载因子 0.75)。:将一次性全量迁移拆分为多次小批量迁移,分摊计算压力。:根据系统负载动态调整扩容阈值。当 HashMap 的。
2025-03-24 07:37:55
418
原创 每日算法题-小美的排列询问
算法整体时间复杂度为O(n),空间复杂度O(n),完美适配题目给定的数据规模限制(2*10^5)。关键点在于利用数组的直接寻址特性实现快速坐标查询,避免了低效的线性搜索操作。小美拿到了一个排列。她想知道在这个排列中,每个元素恰好出现一次。第一行输入一个正整数。第三行输入两个正整数。在排列中相邻,则输出。
2025-03-23 08:02:16
235
原创 每日面试题-为什么在 Java 中编写代码时会遇到乱码问题?
三、HTTP协议层编码缺失(Web开发常见坑)在 Java 开发中遇到乱码问题的根本原因是。一、源码文件编码与编译环境不匹配(高频问题)二、I/O流未指定编码(关键防御点)四、JVM默认编码依赖(跨平台隐患)五、数据库交互编码断层(持久层重点)六、字节字符转换陷阱(底层处理盲区)
2025-03-23 07:58:42
277
原创 CSS id 和 class
📌 特殊注意:在 CSS-in-JS 方案(如 styled-components)中,选择器抽象层级已被重构,但底层仍遵循这些基础原则。
2025-03-22 12:18:19
226
原创 每日算法题-最大可购买的宝石数量
橱窗里有一排宝石,不同的宝石对应不同的价格,宝石的价格标记为。的钱,请问最多能购买到多少个宝石。如无法购买宝石,则返回。个或多个,如果同时出售多个,则要求出售的宝石编号连续;类型的返回值,表示最大可购买的宝石数量。例如客户最大购买宝石个数为。,表示橱窗中宝石的总数量。假设你当前拥有总面值为。,购买的宝石编号必须为。
2025-03-22 11:46:39
98
原创 每日算法题-将企鹅击落水中最小的力
的冰块上,现在通过打破一些冰块来使得企鹅掉落河中,然而他无法打破企鹅所踩的冰块。当两侧的冰块都没有与河两岸连接时,则冰块会掉落到河中。牛牛发明了一款破冰行动的游戏,假设在河面上,有。输出可以击落企鹅到水中的最小力。将一只企鹅放到任意一个标号为。第二行中,按顺序给出代表打破第。题目保证企鹅所在的地方用。每个冰块都有不同的强度。表示,没有企鹅位于冰块。
2025-03-21 20:40:19
208
原创 MySQL 中如何使用 mysqlbinlog 工具进行二进制日志恢复?
【代码】MySQL 中如何使用 mysqlbinlog 工具进行二进制日志恢复?
2025-03-21 19:12:32
148
原创 每日面试题-Python 中如何实现多线程?
在 Python 中实现多线程主要通过threading模块完成,但由于全局解释器锁(GIL)的存在,多线程更适合 I/O 密集型任务而非 CPU 密集型任务。
2025-03-21 08:38:06
105
原创 I/O模型有哪些?
现代高性能系统通常采用I/O多路复用结合线程池(如Reactor模式)或直接使用异步I/O(如Proactor模式)。Linux环境下epoll是实现高并发的核心机制,而Windows平台主要通过IOCP实现真异步I/O。
2025-03-21 08:29:59
142
原创 Synchronized 和 ReentrantLock 有什么区别?
【代码】Synchronized 和 ReentrantLock 有什么区别?
2025-03-20 23:17:59
411
原创 请解释 Kubernetes 中的 ConfigMap 和 Secret 的作用及其使用场景。
通过合理使用 ConfigMap 和 Secret,可实现配置管理的安全性与灵活性统一。Kubernetes 中的。
2025-03-20 08:32:19
298
原创 每日面试题-什么是 Java 的 CAS(Compare-And-Swap)操作?
Java 的是一种无锁(Lock-Free)的原子操作,用于实现多线程环境下的线程安全数据更新。其核心思想是通过硬件指令(如 CPU 的CMPXCHG指令)保证操作的原子性,避免传统锁机制的性能开销和死锁风险。
2025-03-19 07:29:47
455
原创 K8S是什么?
K8S(全称)是由 Google 开源的容器编排与管理平台,用于自动化部署、扩展和管理容器化应用程序。它是云原生计算基金会(CNCF)的核心项目,已成为容器编排领域的行业标准。
2025-03-18 13:24:01
254
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人