基因转换有很多在线工具可以完成,但大批量数据,转换较慢,而且需要实时在线,不利于本地pipline搭建。因此是否有基因ID转换信息可以下载下来使用。一顿寻找,如下。
网址:https://ftp.ncbi.nlm.nih.gov/gene/DATA/GENE_INFO/Mammalia/Homo_sapiens.gene_info.gz
#tax_id | GeneID | Symbol | LocusTag | Synonyms | dbXrefs | chromosome | map_location | description | type_of_gene | Symbol_from_nomenclature_authority | Full_name_from_nomenclature_authority | Nomenclature_status | Other_designations | Modification_date | Feature_type |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
9606 | 123456 | BRCA1 | LT123 | BRCA1A | Ensembl | 17 | p11.2 | Breast cancer susceptibility protein 1 | Protein coding | BRCA1 | Breast Cancer 1, early onset | . | BRCA1A | . | . |
这里是对表格中每一列的解释:
#tax_id: 物种的分类编号,例如9606代表人类。
GeneID: NCBI数据库中分配给每个基因的唯一标识符,例如123456。
Symbol: 基因的官方符号,例如BRCA1。
LocusTag: 基因的标签,例如LT123。
Synonyms: 基因的其他名称或别名,例如BRCA1A。
dbXrefs: 指向其他数据库的交叉引用,例如Ensembl。
chromosome: 基因所在的染色体,例如17。
map_location: 基因在染色体上的具体位置,例如p11.2。
description: 基因的简要描述,例如Breast cancer susceptibility protein 1。
type_of_gene: 基因的类型,例如Protein coding。
Symbol_from_nomenclature_authority: 由命名权威机构提供的基因符号,例如BRCA1。
Full_name_from_nomenclature_authority: 由命名权威机构提供的基因全名,例如Breast Cancer 1, early onset。
Nomenclature_status: 命名状态,指示基因命名的官方认可程度,例如Official。
Other_designations: 基因的其他指定名称或符号,例如BRCA1A。
Modification_date: 基因记录的最后修改日期,例如2024-01-01。
Feature_type: 基因特征的类型,例如CDS(编码序列)。
请注意,Markdown表格的列宽是根据内容自动调整的,而且不支持合并单元格。如果你需要更复杂的表格格式,可能需要使用HTML或者在Markdown中嵌入HTML代码。