求两个字符串中相同的汉字及字母的个数

最新推荐文章于 2024-07-09 20:41:09 发布

weixin_33744854

最新推荐文章于 2024-07-09 20:41:09 发布

阅读量174

点赞数

CC 4.0 BY-SA版权

文章标签： python

原文链接：http://www.cnblogs.com/accumulater/p/6244456.html

本文介绍两种SQL函数用于比较两个字符串并返回匹配字符数。通过示例对比了两种函数的实现方式及结果差异，强调了重复字符计数的区别。

--创建函数

create function [dbo].[funcomparestring]

(

@stra nvarchar(200),

@strb nvarchar(200)

)

returns int as

begin

declare @strbase nvarchar(200)

declare @rank int

select @rank=0

if len(@stra)>len(@strb)

select @rank=count(*)

from funsplitchar(@strb)

where item in(select item from funsplitchar(@stra))

else

select @rank=count(*)

from funsplitchar(@stra)

where item in(select item from funsplitchar(@strb))

return @rank

end

--创建第二种函数

create function [dbo].[funcomparestring_new]

(

@stra nvarchar(200),

@strb nvarchar(200)

)

returns int as

begin

declare @strbase nvarchar(200)

declare @rank int

select @rank=0

if len(@stra)>len(@strb)

select @rank=count(*)

from funsplitchar(@strb)

where item in(select distinct item from funsplitchar(@stra))

else

select @rank=count(*)

from

(

select distinct * from funsplitchar(@stra)

where item in(select distinct item from funsplitchar(@strb))

) bb

return @rank

end

--以上两个函数有什么不同呢？下面我用个例子来给大家说明一下：

--测试示例

select [dbo].[funCompareString]('中国Chinese之家','中国人是Chinese')

--结果为：9

select [dbo].[funCompareString_new]('中国Chinese之家','中国人是Chinese')

--结果为：8

--在这两个字符串中，'ese'与'ese'的重复在第一个函数算个字符重复，

--而在第二个函数中算个字符重复。

--也就是说在第二个函数中，多次相同的重复不累积计算例如ese中的e。

转载于:https://www.cnblogs.com/accumulater/p/6244456.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_33744854

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

两字符串相同字符个数统计问题

小贺的专栏

03-23

6203

坛子里的一个问题，我新手拿来练习练习。测试数据：A B C 2437 345 8750 654 0673 736 0557 012575786 4328778 28796 8537 888 Function TwoStrComp(strOne As String, strTwo As String) As Integer '================================ '取出两个字符串中的重复字符个数 '短字符串中无重复字符的情况下 '=========

比较两个字符串是否有相同的字母且相同字母个数相等

qq_41629348的博客

08-08

3385

问题若给两组字符串如： s1 = ‘Public Relations’ s2 = ‘Crap Built on Lies’ 如果忽略大小写与空格，s1可以通过打乱顺序得到s2，则返回True，否则返回False s1 = 'Public Relations' s2 = 'Crap Built on Lies' import re #变为小写字母 s1 = s1.lower() s2 = s2....

参与评论您还未登录，请先登录后发表或查看评论

【叶子函数分享六】求两个字符串中相同的汉字及字母的个数

沧海一叶点滴心得

03-16

4527

【叶子函数分享六】求两个字符串中相同的汉字及字母的个数

输出两个字符串的相同字符串的个数

cleveryuoyuo的博客

11-03

1114

eg:asdfas werasdfaswer 输出6 我是用两个指针来操作的 xs是长的字符串，ns是短的那个。因为每次从短的开始，遍历长字符串开始的头部，大的需要遍历短字符串的元素个数次。小的每次从短的开始便利长字符串，相同啧开始一同向后遍历，如果长的不会遍历完全，则需要让短的在指向刚开始，长的从上次遍历的下一个位置开始遍历。 #include <iostream> #include <string> using namespace std; int main() { s

找出两个字符串最大相同字符个数

越过山丘

11-28

741

找出两个字符串最大相同字符个数 #include <string.h> #include <stdio.h> int main() { char str1[100], str2[100], tmp[100]; int flag, i, j = 0, max = 0, cnt = 0, tmpN; printf("first one:"); gets(str1); printf("second one:"); gets(str2);

python实现查找两个字符串中相同字符并输出的方法

01-20

本文实例讲述了python实现查找两个字符串中相同字符并输出的方法。分享给大家供大家参考。具体实现方法如下： seq1 = spam seq2 = scam res = [] for x in seq1: if x in seq2: res.append(x) print res 输出...

编写二个函数，其中一个函数func1完成功能为：接收字符串参数，返回一个元组，其中第一个元素为字符串中大写字母个数，

12-20

`func1` 的职责是接收一个字符串作为参数，然后返回一个元组，该元组的第一个元素表示字符串中大写字母的数量，第二个元素则表示小写字母的数量。而 `func2` 的任务是生成一个随机长度不小于10的字符串，并调用 `...

【C语言】提示并输入一个字符串，统计该字符串中字母、数字、空格以及其他字符的个数、提示并输入一个字符串，求出该字符串中所有数字的总和

2301_77133426的博客

07-09

1303

1、提示并输入一个字符串，统计该字符串中字母、数字、空格以及其他字符的个数 2、提示并输入一个字符串，求出该字符串中所有数字的总和 3、定义一个4*3的二维整形数组，完成对二维数组的输入、输出。并将该二维数组中每一行的最值放入到一个一维数组中，并对该一维数组进行升序排序后输出。 4、提示并输入两个一维整形数组，求这两个数组的交集。 5、完成注册和登录功能：使用两个一维字符数组存储账户和密码注册：完成对账号和密码的输入登录：将登录账号和密码跟注册的账号和密码进行匹配，如果相等，则登录成功，否

asp.net中C#获取字符串中汉字的个数的具体实现方法

10-26

另外，还可以使用`Encoding.Default.GetByteCount()`方法来计算字符串中全角字符（通常是汉字）的数量，因为全角字符占用两个字节，而半角字符（如字母和数字）只占用一个字节。例如： ```csharp Console.WriteLine...

统计两个字符串中相同的字符个数（c语言）

u011560479的博客

11-30

8604

输入字符串A、字符串B，求在字符串A、字符串B中相同的字符个数。输入格式: 第一行输入，表示字符串A。第二行输入，表示字符串B。输出格式: 在一行内，输出字符串A、B中相同字符的个数。输入样例: AEIOU HELLO World! 结尾无空行输出样例: 在这里给出相应的输出。例如： 2 结尾无空行 #include<stdio.h> #include<string.h> /*题意为：a,b中相同的字符数，如a:a,b,c,b,c,a; b.

比较两个字符串相同的个数,并输出

weixin_30415801的博客

11-17

930

1 <!DOCTYPE HTML> 2 <html> 3 <head> 4 <meta charset="UTF-8" /> 5 <title>比较两个字符串相同的个数,并输出</title> 6 <script src="jquery-1.12.4.min.js"></scri...

六.求两个字符串中相同的汉字及字母的个数

weixin_33923148的博客

12-19

159

--创建函数 create function [dbo].[funcomparestring] ( @stra nvarchar(200), @strb nvarchar(200) ) returns int as begin declare @strbase nvarchar(200) declare @rank int ...

shell小技巧（八十）统计两个字符串中重复字符个数

bigwood99的博客

05-23

2122

两个字符串统计重复字符个数。字符串中可能有重复字符，不进行排重。 #!/bin/bash #比较2个字符串中，重复字符数 str1="a1b1c2d2ie" str2="x26b7ac1fk" len2=${#str2} let len2-- i=0 icount=0 while [ $i -le $len2 ]; do tmp=${str2:${i}:1} echo $str1 | grep "${tmp}" flag=$? if [ $flag -e...

判断两个字符串有多少相同的字符

shouwang666666的博客

08-06

4433

判断两个字符串有多少相同的字符参考博客：https://blog.youkuaiyun.com/weixin_42586373/article/details/88627417 很详细，也很好，其中正则表达式那个非常好，一行代码解决问题 ...

sql比较两个字符串相同字符的个数

weixin_30273763的博客

07-09

1574

---分拆字符串 create function [dbo].[f_splitstr_word](@SourceSql varchar(8000)) returns @temp table(No_Id int identity(1,1),F1 varchar(100)) as begin declare @i int set @SourceSql=rtrim(ltrim(@So...

两个字符串中含有几个相同字符的几种解法

最新发布

03-25

<think>好的，用户现在想记录每个字符串中每个字母的个数，而不是使用排序后的字符串作为键。我需要调整之前的解决方案来满足这个需求。首先，用户可能对之前的排序方法有疑问，或者他们想尝试另一种方法。他们的目标是分组字母异位词，但希望通过统计字符频率来实现。这可能是因为在某些情况下，排序可能效率不够高，特别是当字符串很长时。或者用户可能想了解不同的实现方式。接下来，我需要考虑如何用字符计数作为哈希表的键。例如，对于"eat"，字符计数是a:1, e:1, t:1。需要将这个计数转换成一种可以作为键的格式。常用的方法是将计数转换为用分隔符连接的字符串，比如"#1#1#0..."，每个位置对应一个字母的出现次数。然后，我需要确保这种方法的正确性。比如，不同长度的字符串可能会有相同的字符计数吗？不太可能，因为字母异位词必须长度相同，所以字符计数的比较是可靠的。另外，要注意大小写问题，原题中的例子都是小写，所以可以假设只有小写字母。如果是其他情况，可能需要调整，但这里应该保持简单。比较两种方法的时间复杂度。排序方法的时间复杂度是O(nk log k)，其中k是字符串的最大长度。而字符计数的方法时间复杂度是O(nk)，因为每个字符串需要遍历所有字符来统计次数。所以当k较大时，字符计数的方法可能更高效，尤其是当k远大于26（字母表大小）时。然后，用户可能需要具体的代码示例。例如，在C++中如何实现字符计数的键。需要遍历每个字符，统计每个字母的出现次数，然后生成键字符串。另外，可能需要处理前导零的情况。例如，对于"aab"，键应该是"2#1#0..."，但需要确保每个字母的位置正确，比如a是第一个，b是第二个，依此类推，直到z。最后，需要比较两种方法的优缺点。排序方法代码简单，但可能效率稍低；字符计数方法可能在处理长字符串时更高效，但代码稍微复杂一些，且生成的键较长，可能占用更多内存。用户可能希望了解这两种方法的适用场景，以及为什么选择其中一种而不是另一种。因此，在回答中需要详细说明这些点，并提供示例代码和复杂度分析，帮助用户做出选择。</think>好的！如果想通过**记录每个字母出现次数**的方式实现字母异位词分组，可以通过设计**字符频率特征作为哈希表的键**来解决。以下是详细步骤和实现方法： --- ### 一、核心思路 - **字母异位词的本质**：两个字符串中每个字符的出现次数完全相同（例如 `"eat"` 和 `"tea"` 的字符频率均为 `a:1, e:1, t:1`） - **哈希表键设计**：将字符频率转换为唯一字符串作为键（例如 `"a1e1t1..."`） --- ### 二、具体实现步骤 #### 1. 统计字符频率对每个字符串遍历字符，统计 `a-z` 每个字母的出现次数。例如 `"eat"` → 统计数组为 `[a:1, e:1, t:1, 其他字母:0]` #### 2. 构建哈希表键将统计的频率数组转换为**固定格式的字符串**，例如用分隔符连接每个字母的计数： - **C++示例**： ```cpp string getKey(string s) { int count[26] = {0}; // 假设仅小写字母 for (char c : s) count[c - 'a']++; string key; for (int i = 0; i < 26; i++) { key += to_string(count[i]) + '#'; // 添加分隔符防止混淆 } return key; } ``` - 示例：`"eat"` → 键为 `"1#1#0#0#...0#1#0#..."`（共26个计数） #### 3. 存入哈希表将每个字符串的键和原始字符串存入 `unordered_map`： ```cpp unordered_map<string, vector<string>> map; for (string s : strs) { string key = getKey(s); map[key].push_back(s); } ``` #### 4. 提取结果遍历哈希表，收集所有分组： ```cpp vector<vector<string>> result; for (auto& pair : map) { result.push_back(pair.second); } ``` --- ### 三、时间复杂度分析 - **统计字符频率**：$O(k)$（$k$ 为字符串长度） - **总时间复杂度**：$O(n \cdot k)$（$n$ 为字符串数量） - **对比排序法**：当 $k$ 较大时，此方法效率更高（排序法为 $O(n \cdot k \log k)$） --- ### 四、两种方法的对比 | **方法** | **键生成方式** | 时间复杂度 | 适用场景 | |---------------------|-------------------|------------------|----------------------| | 字符排序法 | 排序后的字符串 | $O(n \cdot k \log k)$ | 字符串较短时更简洁 | | **字符计数法** | 频率统计字符串 | $O(n \cdot k)$ | 字符串较长时更高效 | --- ### 五、实际应用示例输入：`["eat","tea","tan","ate","nat","bat"]` 输出分组： ```cpp [ ["bat"], // 键"1#1#0#...1#0#..." ["tan","nat"], // 键"1#0#1#...1#0#..." ["eat","tea","ate"] // 键"1#1#0#...1#0#..." ] ``` --- ### 六、为什么选择字符计数法？ 1. **避免排序操作**：直接统计频率，适合长字符串场景 2. **稳定性高**：不受字符顺序影响，逻辑更直观 3. **可扩展性**：若需要支持大小写或特殊字符，只需调整统计范围 --- ### 七、代码优化技巧 1. **压缩键长度**：可以省略末尾连续的 `0#`（需保证唯一性） 2. **预分配内存**：在构建频率字符串时预先分配内存（减少动态扩容开销） 3. **使用数组哈希**：在支持复杂键类型的语言（如Python）中，直接用元组作为键这种方法在LeetCode等算法题中是**高频优化方案**，尤其适合对性能要求较高的场景。