KMP算法DNA的病毒检测

DNA为环状检测一个DNA中是否有病毒DNA序列

#include<string>
#include<iostream>
#include<cstdio>
#include<string.h>
using namespace std;
typedef long long ll;
const int maxn=1e5+5;
char x[maxn], y[maxn]; //模式串 主串
int nex[maxn];
char s[maxn];
int BF(char x[], int m, char y[], int n)
{
	int i,j;
	i=j=0;
	while(i<n && j<m)
	{
		if(y[i]==x[j]) ++i, ++j;
		else i=i-j+1, j=0;
	}
	if(j>=m) return i-j;
	else return -1;
}
void get_nex(char x[], int m, int nex[])
{
	memset(nex, 0, maxn);
	int i, j;
	j=nex[0]=-1;
	i=0;
	while(i<m)
	{
	     while(-1!=j && x[i]!=x[j]) j=nex[j];
		 if(x[++i]==x[++j]) nex[i]==nex[j];
		 else nex[i]=j;
	}
}
int kmp(char x[], int m, char y[], int n)   //模式串 主串
{
	int i, j;
	get_nex(x, m, nex);
	i=j=0;
	while(i<n)
	{
		while(-1!=j && y[i]!=x[j]) j=nex[j];
		i++; j++;
		if(j>=m) return i-j;
	}
	return -1;
}


int main()
{
    while(scanf("%s%s", y,x))
	{
		bool flag=false;
	    int m=strlen(x), n=strlen(y);
	    strcat(x,x),strcat(y,y);   //因为环状都扩大1倍
		for(int i=0; i<m; i++)
		{
			int t=0;
			for(int j=i; j<m+i; j++)
			{
				s[t++]=x[j];  //每个长度m病毒串都跑一遍
			}
			get_nex(s, m, nex);
//		    int pos=BF(s, m, y, 2*n);  //BF
	     	int pos=kmp(s, m, y, 2*n);  //KMP
			if(-1!=pos)
			{
				flag=true;
			}
		}
		if(flag) printf("YES\n");
		else printf("NO\n");
		}
	return 0;
}


/*测试样例
abcda abc  
abcda bcd
abcda cda
abcda daa
abcda aab
abcda aad
abcda aac
*/
### BF算法病毒检测中的应用 布隆过滤器(Bloom Filter, BF)是一种空间效率高的概率型数据结构,用于测试某个元素是否属于一个集合[^1]。它通过多个哈希函数将元素映射到一个位数组上,并利用这些位置上的比特值来判断该元素是否存在。 #### 布隆过滤器的工作原理 布隆过滤器的核心是一个固定大小的位向量以及一组随机独立的哈希函数。当插入一个新的字符串时,每个哈希函数会计算出这个字符串对应的位索引并将对应的位置置为1。查询操作同样依赖于相同的哈希函数集,如果所有由这些哈希函数得出的位置都为1,则认为此字符串可能存在于集合中;如果有任何一个位置不为1,则可以肯定该字符串不在集合内[^2]。 #### 在病毒检测中的实现方式 对于基于签名的病毒扫描引擎来说,维护着大量的已知恶意软件特征码数据库是非常重要的工作之一。然而随着新威胁不断涌现,这种数据库规模日益增大给存储带来了巨大压力。此时采用布隆过滤器能够有效减少内存占用并加快匹配速度: - **初始化阶段**: 将所有的病毒签名经过一系列散列运算后存入布隆滤波器; - **实时监控阶段**: 当接收到文件请求时,先将其内容摘要送入同样的散列机制下得到若干个地址坐标,在布隆滤波器里逐一验证这些坐标的激活状态。一旦发现未被标记过的坐标即刻判定为安全对象无需进一步深入分析从而节省资源消耗[^3]。 需要注意的是由于存在误判率所以实际部署过程中往往还需要配合其他精确方法共同完成最终决策过程。 ```python import mmh3 from bitarray import bitarray class BloomFilter(object): def __init__(self, size, hash_count): self.size = size self.hash_count = hash_count self.bit_array = bitarray(size) self.bit_array.setall(0) def add(self, string): for seed in range(self.hash_count): result = mmh3.hash(string, seed) % self.size self.bit_array[result] = 1 def lookup(self, string): for seed in range(self.hash_count): result = mmh3.hash(string, seed) % self.size if not self.bit_array[result]: return False return True bf = BloomFilter(500000, 7) bf.add('virus_signature_example') print(bf.lookup('virus_signature_example')) # Should output: True ``` 上述代码片段展示了如何创建简单的布隆过滤器类及其基本功能演示[^4]。 问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值