AT_dp_f LCS

AT_dp_f LCS

题目描述

给定一个字符串 sss 和一个字符串 ttt ,输出 sssttt 的最长公共子序列。

输入格式

两行,第一行输入 sss ,第二行输入 ttt

输出格式

输出 sssttt 的最长公共子序列。如果有多种答案,输出任何一个都可以。

说明/提示

数据保证 sssttt 仅含英文小写字母,并且 sssttt 的长度小于等于 300030003000

正解

Part 1

第一件事是弄清楚 LCS 是什么。

LCS 的中文是最长公共子序列,求的是长度。在这道题目中,需要我们求这个字符串到底是什么,第一步就是先求出它的长度。

老规矩:

一、状态:因为这次有两个字符串,所以要开二维数组,即 dpijdp_{i_j}dpij。根据以前的经验,dpijdp_{i_j}dpij 中的 iiijjj 表示的都是结尾的下标,因为要求长度,所以 dpijdp_{i_j}dpij 表示第一个字符串结尾下标为 iii,第二个字符串结尾下标为 jjj,构成最长公共子序列的长度。

二、转移:因为是二维,所以二重循环遍历 iiijjj,这里要分两种情况:

  1. si=tjs_i=t_jsi=tj 时,可以拿这个字符到最长公共子序列中,所以 dpij=dpi−1j−1+1dp_{i_j}=dp_{{i-1}_{j-1}}+1dpij=dpi1j1+1,即多了一个字符。
  2. si≠tjs_i\ne t_jsi=tj 时,只能以 sss 的上一个字符或 ttt 的上一个字符为结尾,取最大值,即 dpij=max⁡(dpi−1j,dpij−1)dp_{i_j}=\max(dp_{{i-1}_j},dp_{i_{j-1}})dpij=max(dpi1j,dpij1)

三、答案:因为转移中的第二小节有提到,我们没法将字符加入最长公共子序列中时,会取前面大的作为答案,所以不需要求所有答案的最大值,只需输出 dpnmdp_{n_m}dpnm 即可。

Part 2

这个时候我们只是知道最长公共子序列的长度,并不是具体的字符串,所以还需要特定的输出。

现在我们可以倒推。令 i=n,j=mi=n,j=mi=n,j=m

  1. si=tjs_i=t_jsi=tj,那么和 Part 1 第二大段的第一小节相反,i−1,j−1i-1,j-1i1,j1,还需要更新答案:ansdpij=si(tj)ans_{dp_{i_j}}=s_i(t_j)ansdpij=si(tj)
  2. dpi−1j>dpij−1dp_{{i-1}_j}>dp_{i_{j-1}}dpi1j>dpij1,因为 Part 1 第二大段的第二小节中只是求最大值,所以需要进一步分析,因为 i−1i-1i1 的情况比 j−1j-1j1 的情况好,所以 i−1i-1i1
  3. 反之,j−1j-1j1

代码

#include <bits/stdc++.h>
#define int long long
using namespace std;

char a[3010],b[3010],ans[3010];
int n,m,dp[3010][3010];

void solve()
{
	cin >> a+1 >> b+1;
	n = strlen(a+1);
	m = strlen(b+1);
	for (int i = 1;i <= n;i++)
		for (int j = 1;j <= m;j++)
			if (a[i] == b[j])
				dp[i][j] = dp[i-1][j-1]+1;
			else
				dp[i][j] = max(dp[i-1][j],dp[i][j-1]);
	int i = n,j = m;
	while (dp[i][j] > 0)
		if (a[i] == b[j])
			ans[dp[i][j]] = a[i],i--,j--;
		else if (dp[i-1][j] > dp[i][j-1])
			i--;
		else
			j--;
	for (int i = 1;i <= dp[n][m];i++)
		cout << ans[i];
}

signed main()
{
	solve();
	printf("\n");
	return 0;
}
### Spell 算法概述 Spell 是 2016 年提出的一种日志解析与模板生成算法,其核心目标是通过无监督学习的方式将原始日志消息自动聚类为结构化的日志模板[^1]。该方法特别适用于大规模、多变的日志数据处理,在系统运维、异常检测和日志分析等领域具有广泛应用。 Spell 的关键在于利用**最长公共子序列(LCS)**来衡量日志消息之间的相似性,并基于此进行增量式聚类。在每一轮迭代中,新到来的日志消息会与已有簇的代表性日志进行比对,计算 LCS 长度并判断是否属于某个现有簇。若不属于任何簇,则创建新的簇。每个簇最终会被归纳为一个日志模板,其中固定部分保留,而变化部分被替换为变量标识符(如 `<*>`)。 相比于传统的日志聚类方法,Spell 的优势在于其**在线学习能力**,能够动态适应新增的日志模式,避免了重新训练整个模型的需求。此外,Spell 在模板生成过程中引入了**上下文敏感机制**,确保模板的语义一致性,提高了日志抽象的质量[^1]。 以下是一个简化的 Spell 模板匹配过程示例: ```python def lcs(X, Y): m = len(X) n = len(Y) dp = [[0] * (n + 1) for _ in range(m + 1)] for i in range(m): for j in range(n): if X[i] == Y[j]: dp[i+1][j+1] = dp[i][j] + 1 else: dp[i+1][j+1] = max(dp[i][j+1], dp[i+1][j]) return dp[m][n] log1 = "Failed to connect to database at 192.168.1.1" log2 = "Failed to connect to database at 10.0.0.2" tokens1 = log1.split() tokens2 = log2.split() similarity = lcs(tokens1, tokens2) print(f"LCS similarity: {similarity}") ``` Spell 算法在实际应用中可作为日志预处理的核心组件,为后续的日志挖掘任务(如异常检测、根因分析等)提供高质量的结构化输入。它尤其适合于需要实时响应的运维场景,能够有效提升日志处理的效率和准确性[^1]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值