792. 匹配子序列的单词数

最新推荐文章于 2025-12-21 15:46:06 发布

原创

最新推荐文章于 2025-12-21 15:46:06 发布 · 679 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #leetcode #python

解决 “判断一个单词是否是字符串的子序列” 问题

题目描述

给定一个字符串 s 和一个字符串数组 words，我们需要返回 words[i] 中有多少个单词是字符串 s 的子序列。

子序列的定义：

一个字符串 w 是另一个字符串 s 的子序列，如果你可以通过删除 s 中的一些字符（可以是 0 个或多个），而不改变剩余字符的相对顺序，得到字符串 w。

例如，字符串 ace 是字符串 abcde 的子序列，因为通过从 abcde 中删除 b 和 d，剩下的字符顺序正好是 ace。

示例：

示例 1：

输入：

s = "abcde"
words = ["a", "bb", "acd", "ace"]

输出：

解释：
有三个单词是 s 的子序列，它们分别是："a", "acd", "ace"。

示例 2：

输入：

s = "dsahjpjauf"
words = ["ahjpjau", "ja", "ahbwzgqnuk", "tnmlanowax"]

输出：

解释：
只有两个单词是 s 的子序列，它们分别是："ahjpjau" 和 "ja"。

解题分析

要解决这个问题，首先需要理解

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Joyner2018

关注关注

19
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

leetcode 792. Number of Matching Subsequences | 792. 匹配子序列的单词数（Java）

寒泉

12-21

3万+

题目 https://leetcode.com/problems/number-of-matching-subsequences/ 题解一看数据规模，普通暴力解法肯定超时了。想了半天怎么用 Trie，没有想出来，于是直奔评论区。作者的代码很简洁易懂，看完之后自己写了一遍。 class Solution { public int numMatchingSubseq(String s, String[] words) { ArrayList<StringBuilder&gt

792 匹配子序列的单词数

weixin_44171872的博客

02-09

266

题目描述：给定字符串 S 和单词字典 words, 求 words[i] 中是 S 的子序列的单词个数。示例: 输入: S = “abcde” words = [“a”, “bb”, “acd”, “ace”] 输出: 3 解释: 有三个是 S 的子序列的单词: “a”, “acd”, “ace”。注意: 所有在words和 S 里的单词都只由小写字母组成。 S 的长度在 [1, 50000]。 words 的长度在 [1, 5000]。 words[i]的长度在[1, 50]。方法1：主要思路：

参与评论您还未登录，请先登录后发表或查看评论

LeetCode每日一题——792. 匹配子序列的单词数

hyk的博客

11-17

740

给定字符串 s 和字符串数组 words, 返回 words[i] 中是s的子序列的单词个数。字符串的 子序列 是从原始字符串中生成的新字符串，可以从中删去一些字符(可以是none)，而不改变其余字符的相对顺序。例如， “ace” 是 “abcde” 的子序列。

【C++二分查找贪心】792. 匹配子序列的单词数|1695

闻缺陷则喜何志丹

08-14

914

leetcode792. 匹配子序列的单词数

weixin_44560620的博客

08-17

202

给定字符串 S 和单词字典 words, 求 words[i] 中是 S 的子序列的单词个数。示例: 输入: S = “abcde” words = [“a”, “bb”, “acd”, “ace”] 输出: 3 解释: 有三个是 S 的子序列的单词: “a”, “acd”, “ace”。 class Solution { public int numMatchingSubseq(String S, String[] words) { int n=S.length(),res=0

Python ：散列表解法 792. 匹配子序列的单词数

Fourier_xyz的博客

11-17

396

字符串的 子序列 是从原始字符串中生成的新字符串，可以从中删去一些字符(可以是none)，而不改变其余字符的相对顺序。一开始就想到用正则匹配秒，没想到超时了。基本上是面向样例编程。

【LeetCode】792. 匹配子序列的单词数

weixin_43894455的博客

11-17

825

day17 二分查找、分桶、分桶优化

Leetcode 792. 匹配子序列的单词数 C++

weixin_43750513的博客

08-04

447

Leetcode 792. 匹配子序列的单词数题目给定字符串 S 和单词字典 words, 求 words[i] 中是 S 的子序列的单词个数。示例: 输入: S = "abcde" words = ["a", "bb", "acd", "ace"] 输出: 3 解释: 有三个是 S 的子序列的单词: "a", "acd", "ace"。注意: 所有在words和 S 里的单词都只由小写字母组成。 S 的长度在 [1, 50000]。 words 的长度在 [1, 5000]。 words[i

LC792. 匹配子序列的单词数

Zach_ar的博客

11-17

161

LC792. 匹配子序列的单词数题解

JAVA程序设计：匹配子序列的单词数自定义字符串排序（LeetCode：792）

信仰.的博客

03-14

539

给定字符串 S 和单词字典 words, 求words[i]中是S的子序列的单词个数。示例: 输入: S = "abcde" words = ["a", "bb", "acd", "ace"] 输出: 3 解释: 有三个是S 的子序列的单词: "a", "acd", "ace"。注意: 所有在words和S里的单词都只由小写字母组成。 S 的长度在[1, 50000]。 ...

【字符串】【暴力枚举+多指针】1、最长特殊序列I+2、最长特殊序列II+3、判断子序列+4、匹配子序列的单词数+5、追加字符以获得子序列

weixin_50512050的博客

06-17

1134

【字符串】【暴力枚举+多指针】1、最长特殊序列I+2、最长特殊序列II+3、判断子序列+4、匹配子序列的单词数+5、追加字符以获得子序列

LeetCode热题100--70. 爬楼梯--简单

2301_80071187的博客

12-20

189

这道题考察爬楼梯问题，每次可以爬1或2个台阶，求爬到n阶的不同方法数。采用动态规划解法，初始化dp数组，dp[0]=1，dp[1]=1。对于i≥2，dp[i]=dp[i-1]+dp[i-2]，即当前台阶的方法数等于前两个台阶方法数之和。最终返回dp[n]即为结果。该解法时间复杂度O(n)，空间复杂度O(n)。

智驾空间智能、物理智能、世界模型相关的最新论文和开源算法链接

Bonaventure的博客

12-16

1034

这些资源涵盖了2025年自动驾驶领域的前沿研究，从空间推理到物理建模和世界模拟，提供了丰富的开源工具和理论框架。建议用户通过链接深入探索论文和代码，以应用于实际项目或进一步研究。如果您需要更详细的解读或特定应用建议，请随时补充信息！

【算法笔记】AC自动机

u012559967的专栏

12-19

720

AC自动机: AC自动机是一种高效的多模式字符串匹配算法，它巧妙地将 Trie树的字典结构与 KMP算法的失配指针思想相结合，能同时在一段文本中查找多个模式串的所有出现位置，广泛应用于敏感词过滤、生物信息学序列分析等领域。在字符串匹配领域，我们会遇到两类问题：单模式匹配：给定一个文本字符串和一个模式字符串，判断模式字符串是否出现在文本字符串中。《【算法笔记】KMP算法》多模式匹配：给定一个文本字符串和多个模式字符串，判断所有模式字符串是否出现在文本字符串中。解决方案：AC自动机算法。

(leetcode) 力扣100 15轮转数组（环状替代）

qq_62235017的博客

12-18

985

我们利用这个过程，首先计算需要多少个从起点走回起点的圈数（count，为数组长度与步数的最大公约数，具体推推导后面会给），然后再遍历每一圈，通过创建一个临时变量（current,next，类似于指针的作用），来存储需要移动的变量将其移动到下一个位置，而下一个位置变为信的需移动变量，直到走完当前圈数。我们可以把数组想象一个圆圈，如果我们每次固定步数前进，肯定会在有限圈数回到出发点，这个过程中，有可能会遍历完数组所有数，有可能遍历有限数。这句话的意思是：在这个游戏中，你启动一次任务，只能覆盖到。

力扣刷题笔记-组合总和

最新发布

qq_42622072的博客

12-21

426

比如candidates = [2,3,6,7], target = 7的时候，第一次先选一个数2，把2加入到path中，这时还没有达到target的值，可以再选一个数，这时还是可以按顺序选[2,3,6,7]中的所有数，做循环尝试，可以就再选2试试，这时path中已经有[2，2]了，和还是没达到target，还可以继续加数，再加一个2试试，最后发现[2，2，2]后面再加数已经不行了，加任何数都走不通了，那么就会把最后加进去的那个 2 踢掉，回到 [2, 2] ，然后在这一层尝试别的选择。

Leetcode 79 最佳观光组合

im_AMBER的博客

12-17

578

每个元素只遍历一次只用了两个变量O(n)O(1)公式拆分是核心：将原得分公式拆分为，把双变量问题转化为单变量的遍历问题。贪心维护最优值：遍历j时，用best维护之前所有i < j中的最大值，这样每一步只需要 O (1) 计算，整体时间复杂度是 O (n)。遍历顺序：因为要求i < j，所以从j=1开始遍历，先计算当前j的得分，再更新best（避免 j 自己和自己配对）。

算法基础（背包问题）-完全背包

2401_87986548的博客

12-20

785

本文介绍了完全背包问题的三种典型应用场景及解法。首先通过牛客网模板题讲解基础完全背包的两种状态（不超过容量和恰好装满），给出状态转移方程和初始化技巧。其次以洛谷P1616为例展示完全背包在采药问题中的简单应用。最后通过P2918和P5662两道题，分别演示了完全背包在"至少重量"限制和动态规划与贪心结合的场景下的解法。所有解法均包含状态表示、转移方程、初始化和空间优化思路，并附参考代码实现。文章通过具体题目展现了完全背包问题的灵活应用和变通解法。

深入解析 JVM 垃圾回收算法：经典 vs 新型 GC 算法

Knight

12-20

621

Java垃圾回收算法演进：从传统到现代摘要： Java垃圾回收算法经历了从传统到现代的演进过程。传统算法包括标记-清除（存在内存碎片问题）、标记-整理（解决碎片但开销大）、复制算法（适合年轻代）和分代收集（区分不同生命周期对象）。现代算法如G1采用分区思想实现低停顿，ZGC和Shenandoah通过并发标记/整理实现毫秒级停顿，都基于三色标记法解决并发问题。随着JDK更新，垃圾回收技术不断优化，G1适用于可控停顿场景，而ZGC/Shenandoah更适合大内存低延迟系统，代表未来发展方向。不同算法各有优劣

difflib.get_close_matches的算法

03-31

<think>好的，我需要回答用户关于difflib.get_close_matches函数的算法实现原理的问题。首先，我得回忆一下自己对Python的difflib模块的了解。这个模块主要用于比较序列之间的差异，而get_close_matches函数是用来找出与目标字符串最接近的匹配项。用户想知道它的具体算法原理，所以我要深入这个函数的实现细节。首先，我应该查阅相关资料，看看官方文档里有没有说明。记得difflib.get_close_matches使用的是模糊字符串匹配，可能基于某种相似度算法，比如Ratcliff-Obershelp算法。这个算法通过计算两个字符串的相似度得分，得分越高表示越相似。然后，我需要确认这个算法是如何工作的。Ratcliff-Obershelp算法的工作原理是找出两个字符串中最长的公共子序列，然后递归地对子序列前后的部分进行同样的处理，最后根据这些子序列的总长度来计算相似度得分。具体来说，它计算的是（2 * 匹配字符数）除以（两个字符串的总长度）。这样得到的比率就是相似度得分，范围在0到1之间。接下来，用户提供的引用中，引用[4]提到了difflib库中的模糊匹配算法，但没有具体说明是哪种。这时候我需要结合自己的知识和引用内容来验证。比如，引用[5]中的例子展示了如何根据相似度找到最接近的匹配项，这符合Ratcliff-Obershelp算法的行为。然后，我需要解释函数的工作流程。当调用get_close_matches时，首先会对每个候选字符串计算与目标字符串的相似度得分，然后根据得分进行排序，并应用cutoff阈值过滤掉低于阈值的候选。最后返回前n个最高得分的匹配项。需要注意的是，这个算法的时间复杂度可能较高，尤其是当候选列表很大时，因为每个候选字符串都需要与目标字符串进行详细的比较。因此，在处理大规模数据时，可能需要考虑性能优化。另外，可能还要提到函数的参数，比如n控制返回结果的数量，cutoff控制相似度的最低要求。用户提供的引用[1]、[3]、[5]中的示例代码展示了这些参数的使用方式，比如设置cutoff为0.6或0.7，n为3等。最后，确保回答结构清晰，分点说明算法原理、工作流程和性能特点，并在适当的地方添加引用标识。同时，生成的相关问题需要与difflib.get_close_matches的应用场景、参数调优、替代算法以及性能优化相关，以帮助用户进一步探索。</think>### difflib.get_close_matches 算法实现原理 `difflib.get_close_matches` 的核心算法基于 **Ratcliff-Obershelp 模式匹配算法**，通过计算字符串之间的相似度得分来实现模糊匹配[^4]。以下是具体实现原理的分步说明： --- #### **1. 相似度计算** 算法的核心是 **Ratcliff-Obershelp 相似度度量**，其计算步骤如下： 1. **寻找最长公共子序列（LCS）**：在两个字符串中找出最长的连续匹配子序列。 2. **递归处理剩余部分**：将 LCS 前的部分和后的部分分别递归进行相同处理。 3. **计算匹配字符总数**：将所有递归过程中找到的匹配字符数相加，记为 $M$。 4. **计算相似度得分**：得分公式为： $$ \text{相似度} = \frac{2 \times M}{|A| + |B|} $$ 其中 $|A|$ 和 $|B|$ 是输入字符串的长度，得分范围在 $0$（完全不相似）到 $1$（完全相同）之间[^4]。 --- #### **2. 工作流程** 当调用 `get_close_matches(word, possibilities, n, cutoff)` 时： 1. **遍历候选列表**：对每个候选字符串计算与目标字符串的相似度得分。 2. **过滤与排序**： - 剔除得分低于 `cutoff`（默认 0.6）的候选项[^1]。 - 按得分从高到低排序，若得分相同则按原始顺序保留。 3. **返回结果**：取前 `n` 个（默认 3）匹配项作为最终结果[^3]。 --- #### **3. 性能特点** - **时间复杂度**：对于 $m$ 个候选字符串，时间复杂度为 $O(m \cdot k)$，其中 $k$ 是字符串平均长度。当候选列表较大时，性能可能显著下降。 - **适用场景**：适合短文本（如单词纠错、模糊搜索）和中小规模候选集。 --- #### **示例说明** 以引用[5]中的代码为例： ```python word = '深圳' poss = ['深山里的圳', '深山里的圳2', '来过深圳', '来过圳深'] difflib.get_close_matches(word, poss) ``` 算法会计算 `'深圳'` 与每个候选项的相似度得分，最终返回得分最高的 `['来过深圳']`，因为其公共子序列更长，相似度更高[^5]。 --- ###