【動態規劃】編輯距離

最新推荐文章于 2024-12-14 21:35:27 发布

原创最新推荐文章于 2024-12-14 21:35:27 发布 · 1.2k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#数据结构 #语言 #file #任务 #编程

OI 专栏收录该内容

177 篇文章

订阅专栏

字符串是数据结构和计算机语言里很重要的数据类型，在计算机语言中，对于字符串我
们有很多的操作定义，因此我们可以对字符串进行很多复杂的运算和操作。实际上，所有复
杂的字符串操作都是由字符串的基本操作组成。例如，把子串a替换为子串b，就是用查找、
删除和插入这三个基本操作实现的。因此，在复杂字符串操作的编程中，为了提高程序中字
符操作的速度，我们就应该用最少的基本操作完成复杂操作。 
在这里，假设字符串的基本操作仅为：删除一个字符、插入一个字符和将一个字符修改
成另一个字符这三种操作。 
我们把进行了一次上述三种操作的任意一种操作称为进行了一步字符基本操作。 
下面我们定义两个字符串的编辑距离：对于两个字符串a和b，通过上述的基本操作，
我们可以把a 变成 b或 b变成 a；那么，把字符串a变成字符串b 需要的最少基本字符操作
步数称为字符串a和字符串b 的编辑距离。 
例如，如 a=“ABC”，b=“CBCD”， 则a与b的编辑距离为2。 
你的任务就是：编一个最快的程序来计算任意两个字符串的编辑距离。 
 
输入数据： 
第 1 行为字符串a；第2行为字符串b。注：字符串的长度不大于1000，字符串中的字
符全为大写字母。 
 
输出数据： 
编辑距离。 
 
样例 
输入文件名：edit.in 
ABC  
CBCD 
 
输出文件名：edit.out 
2

這道題類似於最長公共子序列。
狀態：用f[i][j]表示將s1的前i個字符變成s2的前j個字符所需的最小編輯距離。
轉移方程：f[i][j] = min(f[i - 1][j], f[i][j - 1], f[i - 1][j - 1] + (s1[i] != s2[j]))。
ACCode：

#include <cstdio>
#include <cstring>
#include <cstdlib>
#include <bitset>
using std::min;

const char fi[] = "edit.in";
const char fo[] = "edit.out";
const int maxN = 1010;
const int MAX = 0x3fffff00;
const int MIN = -MAX;

int f[maxN][maxN];
char s1[maxN];
char s2[maxN];
int n, m;

  void init_file()
  {
    freopen(fi, "r", stdin);
    freopen(fo, "w", stdout);
  }
    
  void readdata()
  {
    scanf("%s%s", s1 + 1, s2 + 1);
    n = strlen(s1 + 1);
    m = strlen(s2 + 1);
  }
  
  void work()
  {
    memset(f, 0x3f, sizeof(f));
    f[0][0] = 0;
    for (int i = 0; i < n + 1; ++i)
     for (int j = 0; j < m + 1; ++j)
      {
        if (j > 0) f[i][j] = min(f[i][j],
          f[i][j - 1] + 1);
	//Insert a letter to @s1.
        if (i > 0) f[i][j] = min(f[i][j],
          f[i - 1][j] + 1);
	//Delete the last letter of @s1.
        if (i > 0 && j > 0)
          f[i][j] = min(f[i][j],
            f[i - 1][j - 1] + (s1[i] != s2[j]));
	//Alter the last letter of @s1.
      }
    printf("%d", f[n][m]);
  }
  
int main()
{
  init_file();
  readdata();
  work();
  exit(0);
}