标题
字符串相似度
问题描述
最长公共子串指给定的两个字符串之间最长的相同子字符串(忽略大小写),最长公共子串长度可用来定义字符串相似度。
现给出两个字符串S1和S2,S1的长度为Len1,S2的长度为Len2,假设S1和S2的最长公共子串长度为LCS,则两个字符串的相似度定义为2*LCS/(Len1+Len2)。
例如:S1=”App”,S2=”apple”,S1长度为3,S2长度为5,它们的最长公共子串为”App”,长度为3,则相似度为2*3/(3+5)=0.75。
现给出两个字符串,请计算它们的相似度结果保留3位小数。
输入说明
输入为两行,分别表示两个字符串S1和S2,每个字符串长度不超过100个字符,所有字符均为可打印字符,包括大小写字母,标点符号和空格。
输出说明
输出两个字符串的相似度,结果四舍五入保留3位小数。
输入样例
App
Apple
输出样例
0.750
代码实现
正确代码,但是效率不高
#include <stdio.h>
#include <string.h>
char s1[1001], s2[1001];
void change(char s[]) {
for (register int i = 0; i < strlen(s); i++) {
if (s[i] >= 'A' && s[i] <= 'Z') {
s[i] = s[i] + 32;
}
}
}
int max(int x, int y) {
if (x > y) {
return x;
} else {
return y;
}
}
int main() {
double ans;
gets(s1);
gets(s2);
change(s1);
change(s2);
int len = 0;
for (register int i = 0; i < strlen(s1); i++) {
for (register int j = 0; j < strlen(s2); j++) {
int pos = 0, num = 0;//找到相同字母向后搜索
while (s1[i + pos] == s2[j + pos] && (i + pos) < strlen(s1) && (j + pos) < strlen(s2)) {
num++;//记录长度
pos++;//处理位置
}
len = max(len, num );
}
}
//printf("%d", len);
ans = 2.0 * len / (strlen(s1) + strlen(s2)) * 1.0;
printf("%.3lf", ans);
return 0;
}
记得还有简单方法,但还没有写出来,待续
本文介绍了一个C语言代码片段,用于计算两个字符串的相似度,基于最长公共子串长度,通过改变输入字符串的大小写并使用双层循环查找最长相同子串。提供了一个简单的字符串处理示例,输出结果保留三位小数。
591

被折叠的 条评论
为什么被折叠?



