【動態規劃】編輯距離

字符串是数据结构和计算机语言里很重要的数据类型,在计算机语言中,对于字符串我
们有很多的操作定义,因此我们可以对字符串进行很多复杂的运算和操作。实际上,所有复
杂的字符串操作都是由字符串的基本操作组成。例如,把子串a替换为子串b,就是用查找、
删除和插入这三个基本操作实现的。因此,在复杂字符串操作的编程中,为了提高程序中字
符操作的速度,我们就应该用最少的基本操作完成复杂操作。 
在这里,假设字符串的基本操作仅为:删除一个字符、插入一个字符和将一个字符修改
成另一个字符这三种操作。 
我们把进行了一次上述三种操作的任意一种操作称为进行了一步字符基本操作。 
下面我们定义两个字符串的编辑距离:对于两个字符串a和b,通过上述的基本操作,
我们可以把a 变成 b或 b变成 a;那么,把字符串a变成字符串b 需要的最少基本字符操作
步数称为字符串a和字符串b 的编辑距离。 
例如,如 a=“ABC”,b=“CBCD”, 则a与b的编辑距离为2。 
你的任务就是:编一个最快的程序来计算任意两个字符串的编辑距离。 
 
输入数据: 
第 1 行为字符串a;第2行为字符串b。注:字符串的长度不大于1000,字符串中的字
符全为大写字母。 
 
输出数据: 
编辑距离。 
 
样例 
输入文件名:edit.in 
ABC  
CBCD 
 
输出文件名:edit.out 
2
這道題類似於最長公共子序列。
狀態:用f[i][j]表示將s1的前i個字符變成s2的前j個字符所需的最小編輯距離。
轉移方程:f[i][j] = min(f[i - 1][j], f[i][j - 1], f[i - 1][j - 1] + (s1[i] != s2[j]))。
ACCode:

#include <cstdio>
#include <cstring>
#include <cstdlib>
#include <bitset>
using std::min;

const char fi[] = "edit.in";
const char fo[] = "edit.out";
const int maxN = 1010;
const int MAX = 0x3fffff00;
const int MIN = -MAX;

int f[maxN][maxN];
char s1[maxN];
char s2[maxN];
int n, m;

  void init_file()
  {
    freopen(fi, "r", stdin);
    freopen(fo, "w", stdout);
  }
    
  void readdata()
  {
    scanf("%s%s", s1 + 1, s2 + 1);
    n = strlen(s1 + 1);
    m = strlen(s2 + 1);
  }
  
  void work()
  {
    memset(f, 0x3f, sizeof(f));
    f[0][0] = 0;
    for (int i = 0; i < n + 1; ++i)
     for (int j = 0; j < m + 1; ++j)
      {
        if (j > 0) f[i][j] = min(f[i][j],
          f[i][j - 1] + 1);
	//Insert a letter to @s1.
        if (i > 0) f[i][j] = min(f[i][j],
          f[i - 1][j] + 1);
	//Delete the last letter of @s1.
        if (i > 0 && j > 0)
          f[i][j] = min(f[i][j],
            f[i - 1][j - 1] + (s1[i] != s2[j]));
	//Alter the last letter of @s1.
      }
    printf("%d", f[n][m]);
  }
  
int main()
{
  init_file();
  readdata();
  work();
  exit(0);
}


### C++ 动态规划实现编辑距离算法 #### 问题定义 给定两个字符串 `word1` 和 `word2`,目标是最少操作次数将 `word1` 转换为 `word2`。允许的操作包括插入字符、删除字符和替换字符。 #### 基本思路 动态规划的核心在于构建状态转移方程并逐步求解子问题。对于编辑距离问题,可以通过二维数组 `dp[i][j]` 表示将 `word1[0..i-1]` 转换成 `word2[0..j-1]` 所需的最少操作数[^4]。 #### 状态转移方程 设 `dp[i][j]` 是将 `word1` 的前 `i` 个字符转换成 `word2` 的前 `j` 个字符所需的最小操作数,则有以下情况: - 如果 `word1[i-1] == word2[j-1]`,则无需额外操作: \( dp[i][j] = dp[i-1][j-1] \) - 否则,考虑三种可能的操作: - 插入:\( dp[i][j] = dp[i][j-1] + 1 \) - 删除:\( dp[i][j] = dp[i-1][j] + 1 \) - 替换:\( dp[i][j] = dp[i-1][j-1] + 1 \) 最终取三者中的最小值作为当前状态的结果。 #### 边界条件 当其中一个字符串为空时,另一个字符串需要全部插入或删除才能完成转换: - 当 `i=0` 时,\( dp[0][j] = j \) (表示将空串转为长度为 `j` 的字符串) - 当 `j=0` 时,\( dp[i][0] = i \) (表示将长度为 `i` 的字符串转为空串) #### 代码实现 以下是基于上述分析的 C++ 实现: ```cpp #include <iostream> #include <vector> #include <string> using namespace std; class Solution { public: int minDistance(string word1, string word2) { int m = word1.size(); int n = word2.size(); // 创建 DP 数组 vector<vector<int>> dp(m + 1, vector<int>(n + 1, 0)); // 初始化边界条件 for (int i = 0; i <= m; ++i) { dp[i][0] = i; } for (int j = 0; j <= n; ++j) { dp[0][j] = j; } // 计算 DP 数组 for (int i = 1; i <= m; ++i) { for (int j = 1; j <= n; ++j) { if (word1[i - 1] == word2[j - 1]) { dp[i][j] = dp[i - 1][j - 1]; } else { dp[i][j] = min({dp[i - 1][j], // 删除 dp[i][j - 1], // 插入 dp[i - 1][j - 1]} // 替换 ) + 1; } } } return dp[m][n]; } }; // 测试函数 void test() { Solution sol; cout << sol.minDistance("horse", "ros") << endl; // 输出: 3 cout << sol.minDistance("intention", "execution") << endl; // 输出: 5 } int main() { test(); return 0; } ``` #### 代码解释 1. 使用二维向量 `dp` 存储中间结果。 2. 遍历两字符串的所有字符组合,依据状态转移方程更新 `dp` 数组。 3. 返回右下角元素即为目标结果。 此方法的时间复杂度为 \(O(m \times n)\),其中 \(m\) 和 \(n\) 分别是输入字符串的长度。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值