提取一个数据的子集

最新推荐文章于 2023-10-19 11:22:52 发布

原创最新推荐文章于 2023-10-19 11:22:52 发布 · 981 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#perl

perl 生信教程专栏收录该内容

9 篇文章

订阅专栏

perl脚本练习

要求

根据提供的ID，提取一个数据的子集输出到一个新的文件

数据

表达矩阵
在这里插入图片描述
目标基因ID

思路

目标基因按行循环读取，获得一个哈希，基因名为键
表达矩阵按行读取，提取基因名，判断是否存在哈希的键中，如果存在就输出这一行，没有就跳过

代码

open(IN, "D:/exp.txt") || die "$!";
open(INID, "D:/id.txt") || die "$!";
open(OUT, ">D:/out.txt") || die "$!";

my %keep_id=();
while(my$line=<INID>){
	chomp $line;
	$keep_id{$line}=1;
}
close(INID);

while(my$line=<IN>){
	chomp $line;
	my @tmp=split(/\t/, $line);
	if (exist($keep_id{$tmp[0]}){
		print OUT$line."\n";
	}	
}
close(IN);
close(OUT);