本地不同平台基因ID转换(gene ID,symbol,ensemble, 基因同义词) 开源1

基因转换有很多在线工具可以完成,但大批量数据,转换较慢,而且需要实时在线,不利于本地pipline搭建。因此是否有基因ID转换信息可以下载下来使用。一顿寻找,如下。

网址:https://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gz
在这里插入图片描述

#tax_idGeneIDSymbolLocusTagSynonymsdbXrefschromosomemap_locationdescriptiontype_of_geneSymbol_from_nomenclature_authorityFull_name_from_nomenclature_authorityNomenclature_statusOther_designationsModification_dateFeature_type
9606123456BRCA1LT123BRCA1AEnsembl17p11.2Breast cancer susceptibility protein 1Protein codingBRCA1Breast Cancer 1, early onset.BRCA1A..

这里是对表格中每一列的解释:
#tax_id: 物种的分类编号,例如9606代表人类。
GeneID: NCBI数据库中分配给每个基因的唯一标识符,例如123456。
Symbol: 基因的官方符号,例如BRCA1。
LocusTag: 基因的标签,例如LT123。
Synonyms: 基因的其他名称或别名,例如BRCA1A。
dbXrefs: 指向其他数据库的交叉引用,例如Ensembl。
chromosome: 基因所在的染色体,例如17。
map_location: 基因在染色体上的具体位置,例如p11.2。
description: 基因的简要描述,例如Breast cancer susceptibility protein 1。
type_of_gene: 基因的类型,例如Protein coding。
Symbol_from_nomenclature_authority: 由命名权威机构提供的基因符号,例如BRCA1。
Full_name_from_nomenclature_authority: 由命名权威机构提供的基因全名,例如Breast Cancer 1, early onset。
Nomenclature_status: 命名状态,指示基因命名的官方认可程度,例如Official。
Other_designations: 基因的其他指定名称或符号,例如BRCA1A。
Modification_date: 基因记录的最后修改日期,例如2024-01-01。
Feature_type: 基因特征的类型,例如CDS(编码序列)。
请注意,Markdown表格的列宽是根据内容自动调整的,而且不支持合并单元格。如果你需要更复杂的表格格式,可能需要使用HTML或者在Markdown中嵌入HTML代码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值