题意:有两串字符串,他们都是分类的结果.第一行是正确结果,第二行是需要你判断的.比如:
A A B A B B C C C C
S T R S T R S T R S
当S对应A,T对应B,R对应C时, 它们匹配的位置个数=4
当S对应C,T对应A,B对应R时, 它们匹配的位置个数=5
明显第二种匹配方式更好,字符串相似率达到了5/10=50%.
现在给你很多字符串,要你输出最大相似率.
分析:对于每一个匹配都建立边,求最优匹配注意每次都要清零 KM算法
链接:hdu 3718
#include <iostream>
#include <algorithm>
#include <cstdio>
#include <cmath>
#include <cstring>
#include <string>
#include <set>
#include <map>
#include <stack>
#include <queue>
#define INF 0x3f3f3f3f
using namespace std;
const int inf = 0x3f3f3f3f;
const int maxn = 100;
int n, nx, ny, w[maxn][maxn];
int link[maxn], lx[maxn], ly[maxn], slack[maxn];
bool visx[maxn], visy[maxn];
int xx[10005], yy[10005];
bool dfs(int x){
visx[x] = true;
for(int y = 1; y <= ny; y++){
if(visy[y]) continue;
int t = lx[x] + ly[y] - w[x][y];
if(t == 0){
visy[y] = true;
if(link[y] == -1 || dfs(link[y])){
link[y] = x;
return true;
}
}
else
if(slack[y] > t){ //不在相等子图中slack取最小的
slack[y] = t;
}
}
return false;
}
int KM(){
nx = ny = n;
memset(link, -1, sizeof(link));
memset(ly, 0, sizeof(ly));
for(int i = 1; i <= nx; i++){ //lx 初始化为与它关联边中最大的
lx[i] = -INF;
for(int j = 1; j <= ny; j++){
if(w[i][j] > lx[i]) lx[i] = w[i][j];
}
}
for(int x = 1; x <= nx; x++){
for(int i = 1; i <= ny; i++){
slack[i] = INF;
}
while(true){
memset(visx, false, sizeof(visx));
memset(visy, false, sizeof(visy));
//若成功(找到了增广路),则该点增广完毕,下一个点进入增广
if(dfs(x)) break;
//若失败,则需要改变一些点的顶标,使得图中可行边的数量增加
//(1)将所有在增广轨中的 X 方点的标号 全部减去一个常数 d ;
//(2)将所有在增广轨中的 Y 方点的标号 全部加上一个常数 d ;
int d = INF;
for(int i = 1; i <= ny; i++){
if(!visy[i] && d > slack[i]) d = slack[i];
}
for(int i = 1; i <= nx; i++){
if(visx[i]) lx[i] -= d;
}
for(int i = 1; i <= ny; i++){
if(visy[i]) ly[i] += d;
else slack[i] -= d;
}
}
}
int res = 0;
for(int i = 1; i <= ny; i++){
if(link[i] > -1) res += w[link[i]][i];
}
return res;
}
int main ()
{
int t, kcase = 0;
int N, M, E, k;
char ch;
cin >> t;
while(t--) {
cin >> N >> k >> M;
for(int i = 0; i < N; i++) {
cin >> ch;
xx[i] = ch - 'A' + 1;
}
while(M--) {
memset(w, 0, sizeof(w));
for(int i = 0; i < N; i++) {
cin >> ch;
int kk = ch - 'A' + 1;
w[xx[i]][kk]++;
}
n = 26;
int ans = KM();
printf("%.4f\n", ans * 1.0 / N);
}
/*int sum = 0;
for(int i = 1; i <= N; i++) {
scanf("%d", &E);
sum += w[i][E];
w[i][E]++;
}
sum /= (N + 2);
n = N;
nx = N;
ny = M;
int mm = KM();
printf("%d %d\n", n - mm % (N + 2), mm / (N + 2) - sum);
int ans = 0, flag = 0;
for(int i = 1; i <= n; i++) {
if(w[link[i]][i] == -INF) {
flag = 1;
break;
}
ans += w[link[i]][i];
}
printf("Case %d: ", ++kcase);
if(flag){
puts("-1");
}
else {
printf("%d\n", mm);
}*/
}
return 0;
}
本文介绍了一种基于字符串匹配的问题解决思路,通过构建图模型并使用KM算法来找到最佳匹配方案,实现对两组字符串之间的最大相似度计算。

被折叠的 条评论
为什么被折叠?



