【BioCode】根据seq与位点信息截取窗口

本文介绍了一种从蛋白质序列中根据特定标记截取固定窗口大小的算法,并提供了C++实现代码。该算法能根据标记生成正负样本窗口,适用于生物信息学研究。

代码说明

 

sequence24371.txt

 

以上为所有氨基酸的编号,序列,与位点标记。根据标记为“1”的位点,截取窗口:如下(实验结果):

图示为一个窗口为12的蛋白质片段 2N+1=25;

实现代码:

 

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<algorithm>
#include<iostream>
#define N 12
using namespace std;
void jieduan(int n,char s3[],char s1[],int l)
{
    int i;
    if(n<N)
    {
        for(i=n-N;i<0;i++)
        {
            s3[i+N-n]='*';
        }
        for(i=0;i<=n+N;i++)
        {
            s3[i+N-n]=s1[i];
        }
        s3[i+N-n]='\n';
    }
    else if(n>=l-N)
    {
        for(i=n-N;i<l;i++)
        {
            s3[i+N-n]=s1[i];
        }
        for(i=l;i<=n+N;i++)
        {
            s3[i+N-n]='*';
        }
        s3[i+N-n]='\n';
    }
    else
    {
        for(i=n-N;i<=n+N;i++)
        {
            s3[i+N-n]=s1[i];
        }
        s3[i+N-n]='\n';
    }
}
int main()
{
    int i,j,k,l,m,n;
    char s[10000],s1[10000],s2[10000],s3[100];
    FILE *p1=fopen("sequence24371.txt","r");
    if(p1==NULL) printf("File not open!\n");
    FILE *p2=fopen("positive12.txt","w");
    FILE *p3=fopen("negative12.txt","w");
    while(fgets(s,50000,p1))
    {
        fgets(s1,50000,p1);
        fgets(s2,50000,p1);
        l=strlen(s2)-1;
        for(i=0;i<l;i++)
        {
            if(s1[i]=='K')
            {
                jieduan(i,s3,s1,l);
                
                if(s2[i]=='0')
                {
                    fputs(s3,p3);
                }
                else
                {
                    fputs(s3,p2);
                }
            }
        }
    }
    //system("pause");
    return 0;
}

 

注:

①更改#define N 12 可以任意改变要截取的窗口大小

positive12.txt为生成的正样本窗口,原本标记为“1”

negative12.txt为生成的正样本窗口,原本标记为“0”

 

转载于:https://www.cnblogs.com/yumiaomiao/p/7145932.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值