不同的方法从gtf中提取相关基因组信息in R

本文介绍了使用R语言从GTF文件中提取基因组信息的四种不同方法,包括利用GenomicRanges、annotatr、Bioconductor以及数据处理库plyr。方法涉及创建TxDb对象、读取BAM文件、提取特定特征如第一外显子,并进行重叠分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Method One:

library(GenomicRanges)

library(GenomicFeatures)
library(annotatr)
makeTxDbFromGFF
txdb <- annotatr::makeTxDbFromGFF(gff_file, format="gtf")

GRanges(txdb)

ebg <- transcriptsBy(txdb, by="seqlevels")

anno_info <-  transcriptsBy(txdb, by=c("gene", "exon", "cds",'three_prime_utr','five_prime_utr'), use.names=FALSE)
####abstracting information about mouse gene names

library(org.Mm.eg.db)

x = get(sprintf('org.Mm.egSYMBOL', 'Mm10'))
mapped_genes = mappedkeys(x)
eg2symbol = as.data.frame(x[mapped_genes])
eg2symbol$ensemble <- mapIds(org.Mm.eg.db,keys = eg2symbol$gene_id,keytype = "ENTREZID",column = "ENSEMBL")

print(eg2symbol)

 

Method Two:

sour

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值