LuckyAnJo-优快云博客

原创 Leetcode-100 二分查找常见操作总结

在有序数组nums中查找target的索引（如果存在）。输入，输出2。

2025-04-02 17:08:08 113

MoE（Mixture of Experts）是一种深度学习架构，其核心思想是通过**多个专家网络（Experts）和一个门控网络（Gate Network）**来动态地选择和组合不同的专家，从而提高计算效率和模型能力。MoE 的核心组成专家网络（Experts）MoE 由多个**子神经网络（Experts）**组成，每个专家都是一个独立的子模型（通常是 MLP 或 Transformer 层）。每个专家专注于学习不同的数据模式或特定任务的一部分。门控网络（Gate Network）这是一个。

2025-03-31 21:27:10 905

原创 Leetcode-100 二叉树引发的递归思考

最近公共祖先的定义是：“对于有根树 T 的两个节点 p、q，最近公共祖先表示为一个节点 x，满足 x 是 p、q 的祖先且 x 的深度尽可能大（一个节点也可以是它自己的祖先）。在掌握了二叉树递归的基本思想后，我们通过几道经典例题来深入理解递归的应用方式。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。二叉树的最大深度是指从根节点到最远叶子节点的最长路径上的节点数。，这个路径可能经过根节点，也可能不经过根节点。给定一个二叉树，找出其最大深度。给定一个二叉树，找出其最大深度。

2025-03-31 13:45:30 668

原创 DPO vs PPO

DPO（Direct Preference Optimization）是一种基于人类反馈（Human Feedback, HF）直接优化大语言模型策略的强化学习方法。与传统的强化学习方法不同，DPO并不依赖于复杂的奖励函数，而是通过人类对模型输出的偏好评分，直接对模型进行微调。具体来说，DPO的核心目标是通过对比多个候选答案或策略，并基于人类的偏好反馈来优化生成模型。这一方法的优势在于，能够更直观地利用人类反馈来引导模型的学习，而不需要构建复杂的外部奖励机制。

2025-03-30 15:29:29 662

原创 Leetcode-100 回溯法-单词搜索

核心思想是从网格的每个位置开始，递归地检查是否能拼出目标单词。每次搜索时，我们可以从当前位置往上下左右四个方向扩展，查找下一个字符。单词必须按照字母顺序，通过相邻的单元格内的字母构成，其中“相邻”单元格是那些水平或垂直相邻的单元格。同一个单元格内的字母不允许被重复使用。最坏情况下，我们需要对每个单元格进行 DFS 搜索，每个单元格最多可以向四个方向扩展。数组的空间复杂度为 O(m * n)，递归深度最大为单词的长度。：O(m * n * 4^L)，其中。：O(m * n)，由于。

2025-03-30 14:35:41 374

原创 Leetcode-100 回溯法-括号生成

给定n对括号，编写一个函数，生成所有可能且有效的括号组合。

2025-03-30 13:35:54 246

原创 Leetcode-100 回溯法-组合总数

给定一个的正整数数组candidates和一个目标数target，找出candidates中所有可以使数字和为target的组合。本题可以使用或进行求解。核心思想是递归地选择数组中的元素，并且允许重复选择，直到找到所有符合条件的组合。path。

2025-03-28 23:14:54 509

原创 Leetcode-100 回溯法-电话号码的字母组合

给定一个仅包含数字2-9的字符串，返回所有它能表示的。答案可以按返回。

2025-03-28 21:56:37 435

原创 Leetcode-100 链表常见操作

2025-03-28 15:02:26 291

原创 Leetcode-100 贪心算法

贪心策略具体做法典型问题贪心选择性质选择当前最优的局部解，希望通过局部最优解合成全局最优解。跳跃游戏I、活动选择问题无回溯性每做出选择后，不会回溯到之前的选择，直接向下一个阶段推进。霍夫曼编码问题、最小生成树最优子结构问题的解可以由其子问题的解构成，且子问题的解必须是最优的。贪心算法在最短路径问题（如Dijkstra算法）中的应用局部最优选择每次选择当前阶段的最优解，在问题的整体最优解中，局部最优解能够推动全局最优解的产生。跳跃游戏II、最短路径问题（如Dijkstra算法）按重量选择。

2025-03-24 11:43:44 948

原创 Leetcode-100 回溯法-子集

给定一个的整数数组nums，返回其。解集中，且可以。

2025-03-19 18:22:57 753

原创 Leetcode-100 回溯法-全排列

给定一个不含重复数字的整数数组nums，返回其所有可能的全排列。本解法采用，通过生成排列，而不是使用额外的空间存储路径。这种方法的核心思想是。

2025-03-19 16:38:54 465

原创 Leetcod-100 分割等和子集

给定一个只包含正整数的非空数组 nums，判断是否可以将其分割成两个子集，使得两个子集的元素和相等。

2025-03-13 16:09:48 456

原创动态规划中的自底向上与自顶向下

动态规划（Dynamic Programming，DP）是一种解决复杂问题的方法，它将问题分解为更小的子问题，通过解决这些子问题并存储其解，避免重复计算，从而高效地解决原问题。动态规划的核心思想是利用重叠子问题（overlapping subproblems）和最优子结构（optimal substructure）的性质。

2025-03-12 22:30:17 577

原创 Leetcode-100乘积最大子数组

给定一个整数数组nums，找出数组中乘积最大的非空连续子数组（至少包含一个数字），返回其对应乘积。要求结果在 32 位整数范围内。输入：nums = [2,3,-2,4]输出：6解释：子数组 [2,3] 的乘积是 6，其余子数组乘积均小于 6。

2025-03-05 15:55:07 927

原创 Leetcode-100 最长递增子序列

通过二分查找定位替换位置，贪心策略在每一步都选择当前最优的末尾元素，最终通过维护一个严格递增的tail数组，高效求得最长递增子序列的长度。此方法将时间复杂度从 O(n²) 优化至 O(n log n)，适用于大规模数据场景。通过维护一个单调递增的tail数组，并结合二分查找快速定位插入位置，该方案在保证正确性的前提下大幅提升了效率。此优化体现了贪心选择性质与高效搜索的结合，是处理最长递增子序列问题的标准优化方案。

2025-03-05 15:46:35 974

原创 Leetcode-100 单词拆分

给定一个非空字符串和一个包含非空单词的列表，判断是否可以利用字典中的单词（可重复使用）拼接出完整的字符串。无需使用字典中所有单词，只要存在一种拆分方式即可返回，否则返回。示例：输入：s = “leetcode”, wordDict = [“leet”, “code”]输出：True解释：“leetcode” 可拆分为 “leet” + “code”。本问题采用动态规划（DP）结合记忆化搜索的方法解决。核心思想是将原问题分解为子问题：判断字符串的前缀是否可拆分，并利用已计算的子问题结果避免重

2025-03-05 15:22:31 918

原创 Leetcode-100 零钱兑换

本问题采用**记忆化搜索（Memoized DFS）**的方法解决，核心思想是将问题分解为子问题：对于每个硬币面额，选择使用或不使用该硬币，递归求解剩余金额的最小硬币数。通过缓存中间结果避免重复计算。

2025-03-03 14:57:59 738

原创 Leetcode-100 完全平方数

本问题可以采用**记忆化搜索（DFS + Memoization）**的方法解决，核心思路是通过递归遍历所有可能的平方数组合，利用缓存避免重复计算。关键点在于将问题分解为子问题：对于每个可能的平方数i²，选择或不选择该数，并递归求解剩余部分。

2025-03-03 11:10:32 897

原创 Leetcode-100 动态规划-打家劫舍

prev_max：表示截止到前前个房屋时的最大金额（对应dp[i-2]curr_max：表示截止到前个房屋时的最大金额（对应dp[i-1]

2025-03-03 10:19:11 561

原创 Deepseek-R1-Distill-Llama-8B + Unsloth 中文医疗数据微调实战

内容参考至与。

2025-02-28 15:53:33 583

原创 Leetcode-100 普通数组

在未排序的整数数组中找到缺失的最小正整数（要求时间复杂度 O(n)，空间复杂度 O(1)）输入：intervals = [[1,3],[2,6],[8,10],[15,18]]解释：区间 [1,3] 和 [2,6] 重叠, 将它们合并为 [1,6].输入：nums = [-2,1,-3,4,-1,2,1,-5,4]解释：连续子数组 [4,-1,2,1] 的和最大，为 6。合并所有重叠的区间，返回能覆盖所有原始区间且不重叠的区间数组。输出：[[1,6],[8,10],[15,18]]三次反转操作总次数为。

2025-02-28 11:12:35 682

2501_90713548的博客