【叶子函数分享六】求两个字符串中相同的汉字及字母的个数

最新推荐文章于 2021-11-30 19:22:43 发布

最新推荐文章于 2021-11-30 19:22:43 发布 · 89 阅读

本文介绍了两种SQL函数用于比较字符串相似度的方法，并通过实例演示了两者的区别。第一种函数考虑重复字符，而第二种函数则忽略重复计数。

--创建函数

create function [dbo].[funcomparestring]

(

@stra nvarchar(200),

@strb nvarchar(200)

)

returns int as

begin

declare @strbase nvarchar(200)

declare @rank int

select @rank=0

if len(@stra)>len(@strb)

select @rank=count(*)

from funsplitchar(@strb)

where item in(select item from funsplitchar(@stra))

else

select @rank=count(*)

from funsplitchar(@stra)

where item in(select item from funsplitchar(@strb))

return @rank

end

--创建第二种函数

create function [dbo].[funcomparestring_new]

(

@stra nvarchar(200),

@strb nvarchar(200)

)

returns int as

begin

declare @strbase nvarchar(200)

declare @rank int

select @rank=0

if len(@stra)>len(@strb)

select @rank=count(*)

from funsplitchar(@strb)

where item in(select distinct item from funsplitchar(@stra))

else

select @rank=count(*)

from

(

select distinct * from funsplitchar(@stra)

where item in(select distinct item from funsplitchar(@strb))

) bb

return @rank

end

--以上两个函数有什么不同呢？下面我用个例子来给大家说明一下：

--测试示例

select [dbo].[funCompareString]('中国Chinese之家','中国人是Chinese')

--结果为：9

select [dbo].[funCompareString_new]('中国Chinese之家','中国人是Chinese')

--结果为：8

--在这两个字符串中，'ese'与'ese'的重复在第一个函数算个字符重复，

--而在第二个函数中算个字符重复。

--也就是说在第二个函数中，多次相同的重复不累积计算例如ese中的e。

特别说明：

如果数据量比较大，尽量避免使用自定义函数，以免严重影响性能。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iteye_17377

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

六.求两个字符串中相同的汉字及字母的个数

weixin_33923148的博客

12-19

162

--创建函数 create function [dbo].[funcomparestring] ( @stra nvarchar(200), @strb nvarchar(200) ) returns int as begin declare @strbase nvarchar(200) declare @rank int ...

参与评论您还未登录，请先登录后发表或查看评论

比较两个字符串是否有相同的字母且相同字母个数相等

qq_41629348的博客

08-08

3404

问题若给两组字符串如： s1 = ‘Public Relations’ s2 = ‘Crap Built on Lies’ 如果忽略大小写与空格，s1可以通过打乱顺序得到s2，则返回True，否则返回False s1 = 'Public Relations' s2 = 'Crap Built on Lies' import re #变为小写字母 s1 = s1.lower() s2 = s2....

c++结果没有负数【问题描述】输入一串字符串，根据字符串中字符出现的频率建立相应的哈夫曼树，并构造哈夫曼编码表。在此基础上： 1. 可以对压缩文件进行压缩（即编码）。 2. 可以对压缩后的二进制编码文件进行解压（即译码）。【输入要求】多组数据，每组数据为1行字符串（只考虑26个小写字母）。 • 当输入字符串为“0”时，输入结束。【输出要求】每组数据输出 2n+3行（n为输入字符串中字符类别的个数）： 1. 第1行：统计字符出现频率，格式为“字符:频度”，每两组字符之间用空格分隔，字符按ASCII码从小到大的顺序排列。 2. 第2行至第2n行：哈夫曼树的存储结构终态（如教材第5章表5.2(b)），每行内的数据用空格分隔。 3. 第2n+1行：每个字符的哈夫曼编码，格式为“字符:编码”，每两组字符之间用空格分隔，字符按ASCII码从小到大的顺序排列。 4. 第2n+2行：编码后的字符串。 5. 第2n+3行：解码后的字符串（与输入字符串相同）。

04-28

例如，如果输入字符串是"a0b"，那么count_freq函数中的循环会遍历每个字符，当c为'0'时，会被排除吗？代码中的条件是if(c != '0')，所以此时会统计'a'和'b'，而'0'会被跳过。但根据问题描述，输入字符串中的字符只...

一、实验题目：基于哈夫曼树的数据压缩算法二、实验目的：1、掌握哈夫曼树的构造算法。2、掌握哈夫曼编码的构造算法。三、实验内容：问题描述: 输入一串字符串，根据给定的字符串中字符出现的频率建立相应的哈夫曼树，构造哈夫曼编码表，在此基础上可以对压缩文件进行压缩（即编码），同时可以对压缩后的二进制编码文件进行解压（即译码）。输入要求: 多组数据，每组数据1行，为一个字符串（只考虑26个小写字母即可）。当输入字符串为“0”时，输入结束。输出要求: 每组数据输出2n+3行（n为输入串中字符类别的个数）。第1行为统计出来的字符出现频率（只输出存在的字符，格式为：字符:频度），每两组字符之间用一个空格分隔，字符按照ASCII码从小到大的顺序排列。第2行至第2n行为哈夫曼树的存储结构的终态（如主教材139页表5.2（b）,一行当中的数据用空格分隔）。第2n+1行为每个字符的哈夫曼编码（只输出存在的字符，格式为：字符:编码），每两组字符之间用一个空格分隔，字符按照ASCII码从小到大的顺序排列。第2n+2行为编码后的字符串，第2n+3行为解码后的字符串（与输入的字符串相同）。输入样例： aaaaaaabbbbbccdddd aabccc 0 输出样例： a:7 b:5 c:2 d:4 1 7 7 0 0 2 5 6 0 0 3 2 5 0 0 4 4 5 0 0 5 6 6 3 4 6 11 7 2 5 7 18 0 1 6 a:0 b:10 c:110 d:111 00000001010101010110110111111111111 aaaaaaabbbbbccdddd a:2 b:1 c:3 1 2 4 0 0 2 1 4 0 0 3 3 5 0 0 4 3 5 2 1 5 6 0 3 4 a:11 b:10 c:0 111110000 aabccc

06-03

对于每个字符串，需要统计每个字符的频率，按ASCII顺序输出。然后构造哈夫曼树，输出存储结构的终态，接着是每个字符的哈夫曼编码，编码后的字符串和解码后的字符串。步骤一：统计字符频率。题目要求按ASCII码顺序...

#include<iostream> #include<string.h> #define MAXSIZE 100 using namespace std; typedef struct {//哈夫曼树结点的形式 int weight; //结点的权值 int parent,lchild,rchild; //结点的双亲、左孩子、右孩子的下标 }HTNode,*HuffmanTree; //动态分配数组存储哈夫曼树 typedef char **HuffmanCode; //定义编码表类型 int Search(char a[],char ch) {//查找数组中字符ch所在的位置，返回数组下标，否则返回-1 } void Sort(char a[],int b[],int len) {//按ASCII码冒泡排序 } void Select_min(HuffmanTree HT,int n,int &s1,int &s2) {// 在HT[k](1≤k≤i-1）中选择两个其双亲域为0且权值最小的结点，并返回它们在HT中的序号s1和s2 } int m; void CreateHuffmanTree(HuffmanTree &HT,int n,int b[]) {//构造哈夫曼树HT } void CreateHuffmanCode(HuffmanTree HT,HuffmanCode &HC,int n) {//从叶子到根逆向求每个字符的哈夫曼编码，存储在编码表HC中 } void CharFrequency(char ch[],char a[],int b[],int &j) {//统计词频 } void PrintHT(HuffmanTree HT) {//输出哈夫曼树的存储结构的终态 } void PrintHC(HuffmanCode HC,char a[],int j) {//输出每个字符的哈夫曼编码 } 输入一串字符串，根据给定的字符串中字符出现的频率建立相应哈夫曼树，构造哈夫曼编码表，在此基础上可以对待压缩文件进行压缩（即编码），同时可以对压缩后的二进制编码文件进行解压（即译码）。编程要求输入多组数据，每组数据一行，为一个字符串（只考虑26个小写字母即可）。当输入字符串为“0”时，输入结束。输出每组数据输出2n+4行（n为输入串中字符类别的个数）。第一行为统计出来的字符出现频率（只输出存在的字符，格式为：字符：频度），每两组字符之间用一个空格分隔，字符按照ASCII码从小到大的顺序排列。第二行至第2n行为哈夫曼树的存储结构的终态（形如教材表5.2（b），一行当中的数据用空格分隔）。第2n+2行为每个字符的哈夫曼编码（只输出存在的字符，格式为：字符：编码），每两组字符之间用一个空格分隔，字符按照ASCII码从小到大的顺序排列。第2n+3行为编码后的字符串，第2n+4行为解码后的字符串（与输入的字符串相同）。测试说明平台会对你编写的代码进行测试：测试输入： aaaaaaabbbbbccdddd aabccc 0 预期输出： a:7 b:5 c:2 d:4 1 7 7 0 0 2 5 6 0 0 3 2 5 0 0 4 4 5 0 0 5 6 6 3 4 6 11 7 2 5 7 18 0 1 6 a:0 b:10 c:110 d:111 00000001010101010110110111111111111 aaaaaaabbbbbccdddd a:2 b:1 c:3 1 2 4 0 0 2 1 4 0 0 3 3 5 0 0 4 3 5 2 1 5 6 0 3 4 a:11 b:10 c:0 111110000 aabccc

最新发布

11-22

以下是一个实现根据输入字符串构建哈夫曼树、生成哈夫曼编码表、对字符串进行编码和解码的 C++ 程序。该程序可以处理多组字符串输入，以“0”结束输入，并按指定格式输出字符频率、哈夫曼树存储结构、哈夫曼编码、...

找出一个字符串中重复的字母，并将重复字母的个数输出！

优快云_20162126的博客

04-22

5036

/** 找出一个字符串中重复的字母，并将重复字母的个数输出！*/ public class number { public static void main(String[] args) { String arr="abcdefghijklmnopqrstuvwxyz"; String str="checkgameaction"; char[] a=arr.toCharArray(...

统计两个字符串中相同的字符个数（c语言）

u011560479的博客

11-30

8637

输入字符串A、字符串B，求在字符串A、字符串B中相同的字符个数。输入格式: 第一行输入，表示字符串A。第二行输入，表示字符串B。输出格式: 在一行内，输出字符串A、B中相同字符的个数。输入样例: AEIOU HELLO World! 结尾无空行输出样例: 在这里给出相应的输出。例如： 2 结尾无空行 #include<stdio.h> #include<string.h> /*题意为：a,b中相同的字符数，如a:a,b,c,b,c,a; b.

易语言源码寻找指定字符串出现个数.7z

05-13

易语言源码寻找指定字符串出现个数.7z

sqlserver中求字符串中汉字的个数的sql语句

12-15

关于这个话题，我也看到网上有其他方法来解决。不过从性能和代码量上来看，我有更好的办法。在这里和大家分享。原理其实很简单，知识1、长度函数 len()；知识2、还是长度函数datalength()；代码如下：代码如下: declare @sql varchar(1000) set @sql=’abc国m,de中d国e人民f’ select @sql 字符,DATALENGTH(@sql)-len(@sql) 汉字个数

用c语言实现计算一个字符串中单词的个数

07-29

本文给出计算一个字符串中单词的个数的C语言程序，感性趣的朋友可以看看。

如何判断一个字符是否包含重复的字符

路在前方

10-23

3333

题目描述：判断一个字符串是否包含字符串。分析：最简单的方法就是把这个字符串看作一个字符串数组，对该数组使用双循环进行遍历，即对每个字符，都将这个字符与后面所有的字符进行比较，如果能找到相同的字符，则说明字符串包含有重复的字符。实现代码： package lock; public class T13 { public static boolean isDup(String str) { int len =str.length(); int i; for(i=0;i<len;

计算两个字符串之间的相似度

清风拂面

01-14

2910

1.jaccard相似度：字符级别——相同字符的个数占总字符的个数参考文档：https://blog.youkuaiyun.com/u012836354/article/details/79103099 只是衡量两个字符串之间的相同字符的占比，而未考虑字符的排序导致的两个字符的差异 s1="艾伦图灵传" s2="艾伦图灵传" def jaccard_score(s1,s2): print("s1",set(s1)) print("s2", set(s2)) print("s1&

6.01-re-split_chinese

weixin_30905133的博客

03-30

151

import re # 1.拆分字符串 one = 'asdsfsgsh' # 标准是 s 为拆分 pattern = re.compile('s') result = pattern.split(one) # print(result) # 2.匹配中文 two = '<a href="https://www.baidu.com/" nslog="no...

判断两个字符串所含字符是否完全相等

mimixiao345的专栏

07-21

1095

"Any word or phrase that exactly reproduces the letters in another order is an anagram." (Wikipedia). Add numbers to this definition to be more interest. Examples of anagrams: William Shakespeare

6-10 统计字符串各类字符的个数

优快云_YJX的博客

01-13

1468

统计一个字符串中的字母、数字、空格和其它字符的个数。函数接口定义： void fun(char s[],int b[]); 其中 s 和 b都是用户传入的参数。函数fun统计字符串s中的字母、数字、空格和其它字符的个数，并将结果放在b数组中。裁判测试程序样例： #include "stdio.h" void fun(char s[],int b[]); int main () { char s1[80];int a[4]={0}; int k; gets(s1); fun(s1,a); fo