UVA 11107(Life Forms-后缀数组+二分)

本文介绍了一道经典的UVA竞赛题目——生命形态问题的解决方案。通过对DNA序列进行分析,找到多个序列中最长的共有子串。采用后缀数组和高度数组来高效解决此问题。

Problem C: Life Forms

You may have wondered why most extraterrestrial life forms resemble humans, differing by superficial traits such as height, colour, wrinkles, ears, eyebrows and the like. A few bear no human resemblance; these typically have geometric or amorphous shapes like cubes, oil slicks or clouds of dust.

The answer is given in the 146th episode of Star Trek - The Next Generation, titled The Chase. It turns out that in the vast majority of the quadrant's life forms ended up with a large fragment of common DNA.

Given the DNA sequences of several life forms represented as strings of letters, you are to find the longest substring that is shared by more than half of them.

Standard input contains several test cases. Each test case begins with 1 ≤ n ≤ 100, the number of life forms. n lines follow; each contains a string of lower case letters representing the DNA sequence of a life form. Each DNA sequence contains at least one and not more than 1000 letters. A line containing 0 follows the last test case.

For each test case, output the longest string or strings shared by more than half of the life forms. If there are many, output all of them in alphabetical order. If there is no solution with at least one letter, output "?". Leave an empty line between test cases.

Sample Input

3
abcdefg
bcdefgh
cdefghi
3
xxx
yyy
zzz
0

Output for Sample Input

bcdefg
cdefgh

?

后缀数组第二题
lrj书上的例题。
无聊就去做了。
可是又RE,估计做数据的把n改成10w了
把n改成1千万,过了……【开玩笑的,真相在程序中】

#include<cstdio>
#include<cstring>
#include<cstdlib>
#include<algorithm>
#include<functional>
#include<iostream>
#include<cmath>
#include<cctype>
using namespace std;
#define For(i,n) for(int i=1;i<=n;i++)
#define Fork(i,k,n) for(int i=k;i<=n;i++)
#define Rep(i,n) for(int i=0;i<n;i++)
#define ForD(i,n) for(int i=n;i;i--)
#define RepD(i,n) for(int i=n;i>=0;i--)
#define Forp(x) for(int p=pre[x];p;p=next[p])
#define Lson (x<<1)
#define Rson ((x<<1)+1)
#define MEM(a) memset(a,0,sizeof(a));
#define MEMI(a) memset(a,127,sizeof(a));
#define MEMi(a) memset(a,128,sizeof(a));
#define INF (2139062143)
#define F (100000007)
#define MAXN (10000000+10)
#define MAXL (10001000+10)
long long mul(long long a,long long b){return (a*b)%F;}
long long add(long long a,long long b){return (a+b)%F;}
long long sub(long long a,long long b){return (a-b+(a-b)/F*F+F)%F;}
typedef long long ll;
int sa[MAXL],w[MAXN],wa[MAXL*2]={0},wb[MAXL*2]={0}; //真相:w需要开到MAXL 原因大家都懂的……
bool cmp(int *a,int x,int y,int j){return a[x]==a[y]&&a[x+j]==a[y+j];}
void suffix_array(char *s,int n,int m)
{
	int *x=wa,*y=wb;
	For(i,m) w[i]=0;
	For(i,n) w[x[i]=s[i]]++;
	Fork(i,2,m) w[i]+=w[i-1];
	ForD(i,n) sa[w[x[i]]--]=i;
//	For(i,n) cout<<sa[i]<<' ';cout<<endl;
	for(int j=1,p=0;p<n;j*=2,m=p)
	{
	//	cout<<j<<endl;
		p=0;
		Fork(i,n-j+1,n) y[++p]=i;
		For(i,n) if (sa[i]>j) y[++p]=sa[i]-j;
		
	//	cout<<"y:";For(i,n) cout<<y[i]<<' ';cout<<endl;
		
		For(i,m) w[i]=0;
		For(i,n) w[x[i]]++;
		Fork(i,2,m) w[i]+=w[i-1];
		ForD(i,n) sa[w[x[y[i]]]--]=y[i];
		
		p=y[sa[1]]=1;
		Fork(i,2,n)
			y[sa[i]]=(p+=(!cmp(x,sa[i],sa[i-1],j)));		
	//	cout<<p<<endl;
		int *t=x;x=y;y=t;	
	//	For(i,n) cout<<sa[i]<<' ';cout<<endl;
	}
}
int rank[MAXL],height[MAXL];
void make_height(char *s,int n)
{
	height[1]=0;
	For(i,n) rank[sa[i]]=i;
	For(i,n)
	{
		if (rank[i]==1) continue;
		height[rank[i]]=max(height[rank[i-1]]-1,0);
		while (s[i+height[rank[i]]]==s[sa[rank[i]-1]+height[rank[i]]]) height[rank[i]]++;
	}
}
int n,pre[MAXN],tai[MAXN];
char s[MAXL];

int b[MAXN]={0},belong[MAXL];
int st[2][MAXL]={0},size[2]={0},now_col=1;
int check(int *st,int &size,int p)
{
	memset(b,0,sizeof(b));now_col=1;
	int tot=1;size=0;
	b[belong[sa[1]]]=now_col;
	Fork(i,2,pre[n+1]-1) 
		if (height[i]>=p) {if (b[belong[sa[i]]]^now_col) b[belong[sa[i]]]=now_col,tot++;   }
		else {if (tot>n/2) st[++size]=sa[i-1]; tot=1;now_col++;b[belong[sa[i]]]=now_col; }
	return size;
}
char fillchar[MAXN];
int main()
{
//	freopen("uva11107.in","r",stdin);
	
	int p=0;
	For(i,'a'-1) fillchar[++p]=i;
	for(int i='z'+1;p<=100;i++) fillchar[++p]=i;
	
	bool b=0;
	while(scanf("%d",&n))
	{
		if (n) {if (b) puts("");}
		else break;
		pre[1]=1;
		For(i,n)
		{
			scanf("%s",s+pre[i]);tai[i]=strlen(s+pre[i]);
			s[pre[i]+tai[i]]=fillchar[i];pre[i+1]=pre[i]+tai[i]+1;
			Fork(j,pre[i],pre[i]+tai[i]) belong[j]=i;
		}
		s[pre[n+1]]=0;
		suffix_array(s,pre[n+1]-1,200);
		make_height(s,pre[n+1]-1);
	//	For(i,pre[n+1]-1) cout<<s[i]<<' ';cout<<endl;
	//	For(i,pre[n+1]-1) cout<<rank[i]<<' ';cout<<endl;
	//	For(i,pre[n+1]-1) cout<<height[i]<<' ';cout<<endl;
		int l=1,r=pre[n+1]-1,ans=0,p=0;
		while (l<=r)
		{
			int m=l+r>>1;
			if (check(st[p],size[p],m)) ans=m,l=m+1,p^=1;
			else r=m-1;
		}
		if (ans==0) puts("?");
		else
		{
			p^=1;
		//	cout<<ans<<endl;
			For(i,size[p]) {Fork(k,st[p][i],st[p][i]+ans-1) cout<<s[k];cout<<endl;}
		}
		b=1;
	}
	
	return 0;
}






基于TROPOMI高光谱遥感仪器获取的大气成分观测资料,本研究聚焦于大气污染物一氧化氮(NO₂)的空间分布与浓度定量反演问题。NO₂作为影响空气质量的关键指标,其精确监测对环境保护与大气科学研究具有显著价值。当前,利用卫星遥感数据结合先进算法实现NO₂浓度的高精度反演已成为该领域的重要研究方向。 本研究构建了一套以深度学习为核心的技术框架,整合了来自TROPOMI仪器的光谱辐射信息、观测几何参数以及辅助气象数据,形成多维度特征数据集。该数据集充分融合了不同来源的观测信息,为深入解析大气中NO₂的时空变化规律提供了数据基础,有助于提升反演模型的准确性与环境预测的可靠性。 在模型架构方面,项目设计了一种多分支神经网络,用于分别处理光谱特征与气象特征等多模态数据。各分支通过独立学习提取代表性特征,并在深层网络中进行特征融合,从而综合利用不同数据的互补信息,显著提高了NO₂浓度反演的整体精度。这种多源信息融合策略有效增强了模型对复杂大气环境的表征能力。 研究过程涵盖了系统的数据处理流程。前期预处理包括辐射定标、噪声抑制及数据标准化等步骤,以保障输入特征的质量与一致性;后期处理则涉及模型输出的物理量转换与结果验证,确保反演结果符合实际大气浓度范围,提升数据的实用价值。 此外,本研究进一步对不同功能区域(如城市建成区、工业带、郊区及自然背景区)的NO₂浓度分布进行了对比分析,揭示了人类活动与污染物空间格局的关联性。相关结论可为区域环境规划、污染管控政策的制定提供科学依据,助力大气环境治理与公共健康保护。 综上所述,本研究通过融合TROPOMI高光谱数据与多模态特征深度学习技术,发展了一套高效、准确的大气NO₂浓度遥感反演方法,不仅提升了卫星大气监测的技术水平,也为环境管理与决策支持提供了重要的技术工具。 资源来源于网络分享,仅用于学习交流使用,请勿用于商业,如有侵权请联系我删除!
评论 2
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值