【叶子函数分享六】求两个字符串中相同的汉字及字母的个数

本文介绍了两种SQL函数用于比较字符串相似度的方法,并通过实例演示了两者的区别。第一种函数考虑重复字符,而第二种函数则忽略重复计数。

--创建函数

create function [dbo].[funcomparestring]

(

@stra nvarchar(200),

@strb nvarchar(200)

)

returns int as

begin

declare @strbase nvarchar(200)

declare @rank int

select @rank=0

if len(@stra)>len(@strb)

select @rank=count(*)

from funsplitchar(@strb)

where item in(select item from funsplitchar(@stra))

else

select @rank=count(*)

from funsplitchar(@stra)

where item in(select item from funsplitchar(@strb))

return @rank

end

go

--创建第二种函数

create function [dbo].[funcomparestring_new]

(

@stra nvarchar(200),

@strb nvarchar(200)

)

returns int as

begin

declare @strbase nvarchar(200)

declare @rank int

select @rank=0

if len(@stra)>len(@strb)

select @rank=count(*)

from funsplitchar(@strb)

where item in(select distinct item from funsplitchar(@stra))

else

select @rank=count(*)

from

(

select distinct * from funsplitchar(@stra)

where item in(select distinct item from funsplitchar(@strb))

) bb

return @rank

end

--以上两个函数有什么不同呢?下面我用个例子来给大家说明一下:

--测试示例

select [dbo].[funCompareString]('中国Chinese之家','中国人是Chinese')

--结果为:9

select [dbo].[funCompareString_new]('中国Chinese之家','中国人是Chinese')

--结果为:8

--在这两个字符串中,'ese''ese'的重复在第一个函数算个字符重复,

--而在第二个函数中算个字符重复。

--也就是说在第二个函数中,多次相同的重复不累积计算例如ese中的e

特别说明:

如果数据量比较大,尽量避免使用自定义函数,以免严重影响性能。

一、实验题目:基于哈夫曼树的数据压缩算法 二、实验目的:1、掌握哈夫曼树的构造算法。2、掌握哈夫曼编码的构造算法。 三、实验内容: 问题描述: 输入一串字符串,根据给定的字符串中字符出现的频率建立相应的哈夫曼树,构造哈夫曼编码表,在此基础上可以对压缩文件进行压缩(即编码),同时可以对压缩后的二进制编码文件进行解压(即译码)。 输入要: 多组数据,每组数据1行,为一个字符串(只考虑26个小写字母即可)。当输入字符串为“0”时,输入结束。 输出: 每组数据输出2n+3行(n为输入串中字符类别的个数)。 第1行为统计出来的字符出现频率(只输出存在的字符,格式为:字符:频度),每两组字符之间用一个空格分隔,字符按照ASCII码从小到大的顺序排列。第2行至第2n行为哈夫曼树的存储结构的终态(如主教材139页表5.2(b),一行当中的数据用空格分隔)。第2n+1行为每个字符的哈夫曼编码(只输出存在的字符,格式为:字符:编码),每两组字符之间用一个空格分隔,字符按照ASCII码从小到大的顺序排列。第2n+2行为编码后的字符串,第2n+3行为解码后的字符串(与输入的字符串相同)。 输入样例: aaaaaaabbbbbccdddd aabccc 0 输出样例: a:7 b:5 c:2 d:4 1 7 7 0 0 2 5 6 0 0 3 2 5 0 0 4 4 5 0 0 5 6 6 3 4 6 11 7 2 5 7 18 0 1 6 a:0 b:10 c:110 d:111 00000001010101010110110111111111111 aaaaaaabbbbbccdddd a:2 b:1 c:3 1 2 4 0 0 2 1 4 0 0 3 3 5 0 0 4 3 5 2 1 5 6 0 3 4 a:11 b:10 c:0 111110000 aabccc
06-03
#include<iostream> #include<string.h> #define MAXSIZE 100 using namespace std; typedef struct {//哈夫曼树结点的形式 int weight; //结点的权值 int parent,lchild,rchild; //结点的双亲、左孩子、右孩子的下标 }HTNode,*HuffmanTree; //动态分配数组存储哈夫曼树 typedef char **HuffmanCode; //定义编码表类型 int Search(char a[],char ch) {//查找数组中字符ch所在的位置,返回数组下标,否则返回-1 } void Sort(char a[],int b[],int len) {//按ASCII码冒泡排序 } void Select_min(HuffmanTree HT,int n,int &s1,int &s2) {// 在HT[k](1≤k≤i-1)中选择两个其双亲域为0且权值最小的结点,并返回它们在HT中的序号s1和s2 } int m; void CreateHuffmanTree(HuffmanTree &HT,int n,int b[]) {//构造哈夫曼树HT } void CreateHuffmanCode(HuffmanTree HT,HuffmanCode &HC,int n) {//从叶子到根逆向每个字符的哈夫曼编码,存储在编码表HC中 } void CharFrequency(char ch[],char a[],int b[],int &j) {//统计词频 } void PrintHT(HuffmanTree HT) {//输出哈夫曼树的存储结构的终态 } void PrintHC(HuffmanCode HC,char a[],int j) {//输出每个字符的哈夫曼编码 } 输入一串字符串,根据给定的字符串中字符出现的频率建立相应哈夫曼树,构造哈夫曼编码表,在此基础上可以对待压缩文件进行压缩(即编码),同时可以对压缩后的二进制编码文件进行解压(即译码)。 编程要 输入 多组数据,每组数据一行,为一个字符串(只考虑26个小写字母即可)。当输入字符串为“0”时,输入结束。 输出 每组数据输出2n+4行(n为输入串中字符类别的个数)。第一行为统计出来的字符出现频率(只输出存在的字符,格式为:字符:频度),每两组字符之间用一个空格分隔,字符按照ASCII码从小到大的顺序排列。第二行至第2n行为哈夫曼树的存储结构的终态(形如教材表5.2(b),一行当中的数据用空格分隔)。第2n+2行为每个字符的哈夫曼编码(只输出存在的字符,格式为:字符:编码),每两组字符之间用一个空格分隔,字符按照ASCII码从小到大的顺序排列。第2n+3行为编码后的字符串,第2n+4行为解码后的字符串(与输入的字符串相同)。 测试说明 平台会对你编写的代码进行测试: 测试输入: aaaaaaabbbbbccdddd aabccc 0 预期输出: a:7 b:5 c:2 d:4 1 7 7 0 0 2 5 6 0 0 3 2 5 0 0 4 4 5 0 0 5 6 6 3 4 6 11 7 2 5 7 18 0 1 6 a:0 b:10 c:110 d:111 00000001010101010110110111111111111 aaaaaaabbbbbccdddd a:2 b:1 c:3 1 2 4 0 0 2 1 4 0 0 3 3 5 0 0 4 3 5 2 1 5 6 0 3 4 a:11 b:10 c:0 111110000 aabccc
最新发布
11-22
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值