Perl脚本练习
通过数组和哈希引用读取存储复杂数据
要求
gff文件,记录每个基因的名称、起始终止位置、染色体、转录本信息
数据
#注释行
分割:\t
9列:gff格式

思路
- 构建一个哈希,结构
my%gene = (
geneID => {
'location' => [chrs, start, end]
'transcripts' => [
{
'mRNAID' => 111,
'chr' => 111,
'start' => 111,
'end' =>111
}
]
}
)
- 按行读入gff,split,判断注释信息类型,如果为gene,将染色体和位置信息存入以基因ID命名的键中
- 如果为mRNA,捕获位置信息,ID和parent信息,根据parent信息将mRNA信息放入对应基因的键中
脚本
use Data::Dumper;
open IN, "D:/test.gff3" or die "$!";
my %geneInfo =();
while(my $line = <IN>){
chomp $line;
next if ($line = ~/^#/);
my@tm
使用Perl处理GFF文件

这篇博客介绍了如何通过Perl脚本读取和处理GFF文件,特别是关注基因和转录本信息。文章详细阐述了处理思路,即构建哈希结构,按行读取GFF数据,区分注释和基因/mRNA信息,存储在相应的哈希键中。
最低0.47元/天 解锁文章
2334

被折叠的 条评论
为什么被折叠?



