要确定GCST90693191.tsv代谢数据集的基因组版本,核心是利用其**GCST编号的归属(IEU OpenGWAS项目)

要确定GCST90693191.tsv代谢数据集的基因组版本,核心是利用其GCST编号的归属(IEU OpenGWAS项目),从数据内容、官方数据库或原始文献三个维度查询,以下是具体可操作的方法:

https://ftp.ebi.ac.uk/pub/databases/gwas/summary_statistics/GCST90693001-GCST90694000/GCST90693195/GCST90693195.tsv-meta.yaml
找到对应的注释文件 。查看就知道了

研究元数据

gwas_id: GCST90693195
作者注释:“引用\nKurniansyah N, Strausz SJ, Chittoor G, Gupta S, Justice AE,,
Hrytsenko Y,Keenan BT,Cade BE,Spitzer BW,Wang H,Huffman J,Moll MR,Haring
B, Jung SY, Raffield LM, Kaplan R, Rotter JI, Rich SS, Gharib SA, Bartz TM, Liu
PY, Chen H, Fornage M, Hou L, Levy D, Morrison AC, Ochs-Balcom HM, Psaty BM, Wilson
PWF, Cho K, Pack AI, Ollila HM, Redline S, Gottlieb DJ, Sofer T;FinnGen;VA Million
退伍军人计划。阻塞性睡眠呼吸暂停的多基因评分揭示了相关途径
与心血管疾病有关。EBioMedicine. 2025;117:105790. doi:10.1016/j.ebiom.2025.105790."
gwas_catalog_api:https://www.ebi.ac.uk/gwas/rest/api/studies/GCST90693195
日期元数据最后修改时间:2025-10-14

特征信息

特性描述:

  • 阻塞性睡眠呼吸暂停
    本体映射:
  • EFO_0003918

基因分型信息

基因组组装:GRCh38
坐标系:从1开始
基因分型技术:

  • 全基因组基因分型芯片
    插补面板:NA
    插补软件:‘MVP:Eagle/Minimac | FinnGen:Eagle 2.3.5 + Beagle 4.12’

样本信息

样本:

  • sample_ancestry_category:
    • 欧洲人
    • 东亚
    • 非裔美国人或加勒比黑人
    • 西班牙裔或拉丁美洲裔
      样本血统:
    • 不适用
      样本量:700902
      血统追溯方法:
    • 不适用
      病例对照研究:是
      性别:男

汇总统计信息

数据文件名:GCST90693195.tsv
文件类型:GWAS-SSF v1.0
数据文件MD5校验码:dca69761dbe551cbedb0f8bbd24eb013
分析软件:无
调整后的协变量:

  • “年龄”
  • “性别”
    “基因分型芯片/批次”
  • “10件”
  • “遗传相关性”

协调状态

是否已协调:否
是否已排序:否

其他参考即可

一、先查数据集文件本身:看是否有直接注释

数据集的TSV文件中,通常会在表头注释特定列说明中标注基因组版本,这是最直接的方式。

  1. 查看文件头部注释
    用文本编辑器(如Notepad++、RStudio的readLines())打开TSV文件,查看前10-20行(通常是注释行,以#开头)。

    • 关键关键词:genome buildassemblyGRCh37GRCh38hg19hg38
    • 示例注释可能为:# Genome assembly: GRCh37# SNP positions based on hg19
  2. 查看染色体位置列的“隐含线索”
    若没有直接注释,可观察chromosome(染色体)和position(位置)列的数值:

    • 若染色体号为1-22, X, Y(无chr前缀),且位置数值与GRCh37/hg19的坐标匹配(可对比dbSNP对应rsID的位置),大概率是GRCh37/hg19(IEU OpenGWAS早期数据集多为此版本);
    • 若染色体号带chr前缀(如chr1),或位置数值与GRCh38/hg38匹配,可能是GRCh38/hg38(近年新数据集可能用此版本)。

二、核心方法:通过GCST编号查IEU OpenGWAS官方信息

GCST开头的编号是IEU OpenGWAS项目(国际流行病学联盟开放GWAS数据库)的标准编号,该项目会为每个数据集记录详细的元信息,包括基因组版本。

方法1:网页端直接查询(无需代码,最推荐)
  1. 打开IEU OpenGWAS的官方查询页面:https://gwas.mrcieu.ac.uk/datasets/
  2. 在搜索框输入GCST90693191,点击对应数据集进入详情页;
  3. 查看“Metadata”(元数据)部分,找到“Genome build”或“Assembly”字段,即可直接获取基因组版本(如“GRCh37”)。
方法2:用R的ieugwasr包查询(适合代码流)

若你习惯用R处理数据,可通过ieugwasr包直接调用IEU数据库的元信息,无需手动打开网页:

# 加载包(若未安装先执行 install.packages("ieugwasr"))
library(ieugwasr)

# 查询GCST90693191的元数据(含基因组版本)
dataset_meta <- gwasinfo("GCST90693191")

# 提取基因组版本信息
genome_build <- dataset_meta$build
cat("该数据集的基因组版本:", genome_build)
  • 输出示例:该数据集的基因组版本:GRCh37(IEU OpenGWAS的多数代谢类数据集默认用GRCh37/hg19)。

三、补充方法:查数据集对应的原始研究文献

若上述方法未找到,可通过GCST编号关联到原始GWAS研究,文献的“方法学”或“补充材料”会明确基因组版本:

  1. 在IEU OpenGWAS的数据集详情页(方法1的步骤3),找到“Publication”字段,获取原始文献的DOI或标题;
  2. 用DOI在PubMed或Google Scholar中检索文献;
  3. 查看文献的“Methods”部分,寻找“SNP genotyping”或“Imputation”相关描述,通常会写“Genotypes were imputed to the 1000 Genomes Project reference panel (GRCh37)”这类信息,即基因组版本为GRCh37。

总结:优先按这3步查

  1. 快速扫文件注释:1分钟内判断是否有直接标注;
  2. 查IEU OpenGWAS官方信息:通过网页或ieugwasr包,100%能获取准确版本(最可靠);
  3. 补查原始文献:若前两步异常,文献是最终确认依据。

多数情况下,GCST系列代谢数据集的基因组版本为GRCh37(对应hg19),但需以官方查询结果为准,避免因版本错配导致后续分析(如位置转rsID)出错。

GCST数据集基因组版本查询的步骤文档?包含网页查询截图指引和R代码模板,方便你后续处理其他GCST编号的数据集

以下是《GCST数据集基因组版本查询步骤文档》,涵盖文件自查、官方数据库查询(网页+代码)、文献验证等方法,步骤清晰可操作,方便快速确认基因组版本(如GRCh37/hg19、GRCh38/hg38)。

GCST数据集基因组版本查询步骤文档

(适用于IEU OpenGWAS项目的GCST编号数据集,如代谢、表型相关GWAS数据)

一、背景说明

GCST开头的编号是IEU OpenGWAS项目(国际流行病学联盟开放GWAS数据库)的标准化数据集编号,包含GWAS分析结果(如SNP、效应量、染色体位置等)。基因组版本(如GRCh37/hg19、GRCh38/hg38)是数据后续分析(如位置转rsID、跨数据集合并)的关键前提,需准确确认。

二、查询步骤(按优先级排序)

方法1:直接查看数据集文件内部注释(最快)

数据集文件(如GCST90693191.tsv)通常会在头部注释中直接标注基因组版本,适合快速初步判断。

操作步骤:
  1. 用文本编辑器(如Notepad++、VS Code、RStudio)打开TSV文件;
  2. 查看文件前10-20行(注释行通常以#开头),寻找关键词:
    • 核心关键词:genome buildassemblyGRCh37GRCh38hg19hg38
    • 示例注释:# Genome assembly used: GRCh37# SNP positions based on hg19
  3. 若找到上述关键词,直接记录对应的基因组版本即可。

方法2:通过IEU OpenGWAS网页查询(最权威)

IEU OpenGWAS官方数据库会为每个GCST数据集存储完整元信息,包括明确的基因组版本,是最可靠的方法。

操作步骤:
  1. 打开IEU OpenGWAS数据集查询页面:
    网址:https://gwas.mrcieu.ac.uk/datasets/(需联网)。
  2. 在页面顶部的搜索框中输入目标GCST编号(如GCST90693191),点击搜索结果中的数据集名称进入详情页(如图1示意)。
    搜索示意
  3. 在详情页中,下拉找到“Metadata”(元数据)模块,查看“Genome build”字段,该字段即为数据集对应的基因组版本(如图2示意)。
    元数据示意
    示例结果:Genome build: GRCh37(多数代谢类GCST数据集默认使用GRCh37)。

方法3:用R的ieugwasr包查询(适合代码流)

若习惯用R处理数据,可通过ieugwasr包直接调用IEU数据库接口,批量或程序化获取基因组版本。

操作步骤:
  1. 安装并加载ieugwasr包(若未安装):

    # 安装包
    if (!require("ieugwasr")) {
      install.packages("ieugwasr")
    }
    # 加载包
    library(ieugwasr)
    
  2. 查询目标GCST数据集的元信息(含基因组版本):

    # 替换GCST编号为你的目标数据集(如"GCST90693191")
    gcst_id <- "GCST90693191"
    # 获取元数据
    dataset_meta <- gwasinfo(gcst_id)
    
  3. 提取并查看基因组版本:

    # 从元数据中提取基因组版本
    genome_build <- dataset_meta$build
    # 打印结果
    cat(paste("GCST编号", gcst_id, "的基因组版本:", genome_build, "\n"))
    

    示例输出:
    GCST编号 GCST90693191 的基因组版本:GRCh37

方法4:查阅原始研究文献(补充验证)

若上述方法未明确,可通过数据集关联的原始文献确认,文献方法部分会详细说明基因组版本。

操作步骤:
  1. 在IEU OpenGWAS数据集详情页(方法2的步骤2),找到“Publication”模块,获取文献的DOI(如10.1038/s41588-023-01528-x)或标题。
  2. 用DOI在PubMed(https://pubmed.ncbi.nlm.nih.gov/)或Google Scholar中检索文献。
  3. 查看文献的“Methods”部分,寻找“SNP genotyping”“Imputation”或“Reference panel”相关描述,例如:
    • 常见表述:Genotypes were imputed using the 1000 Genomes Project phase 3 reference panel (GRCh37)(明确基因组版本为GRCh37)。

三、注意事项

  1. 版本一致性:确认后,后续分析(如用biomaRtSNPlocs转换位置到rsID)需使用匹配的基因组版本(如GRCh37对应grch37.ensembl.org数据库)。
  2. 文件完整性:若方法1未找到注释,可能是文件被截断或未包含头部信息,优先用方法2/3查询。
  3. 网络问题:方法2/3需联网,若网页加载慢,可尝试更换网络或稍后重试;ieugwasr查询失败时,可更新包至最新版本(update.packages("ieugwasr"))。

四、总结

  • 优先推荐:方法2(网页查询)方法3(R代码查询),直接获取官方元数据,结果最准确。
  • 快速判断:方法1(文件自查),适合初步确认。
  • 补充验证:方法4(文献查阅),适合复杂或旧数据集。

通过以上步骤,可高效确认GCST数据集的基因组版本,为后续分析奠定基础。

################################################## 开始暴露因素预处理... 完成暴露预处理,共处理 0 个暴露因素 ================================================== 开始处理结局因素:GCST90274758.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274759.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274760.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274761.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274762.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274763.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274764.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274765.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274766.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274767.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274768.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274769.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274770.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274771.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274772.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274773.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274774.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274775.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274776.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274777.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274778.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274779.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274780.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274781.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274782.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274783.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274784.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274785.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274786.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274787.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274788.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274789.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274790.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274791.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274792.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274793.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274794.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274795.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274796.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274797.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274798.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274799.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274800.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274801.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274802.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274803.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274804.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274805.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274806.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274807.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274808.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274809.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274810.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274811.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274812.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274813.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274814.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274815.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274816.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274817.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274818.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274819.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274820.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274821.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274822.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274823.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274824.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274825.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274826.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274827.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274828.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274829.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274830.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274831.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274832.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274833.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274834.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274835.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274836.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274837.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274838.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274839.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274840.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274841.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274842.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274843.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274844.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274845.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274846.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274847.tsv 结局数据加载失败:没有"verify"这个函数 ================================================== 开始处理结局因素:GCST90274848.tsv 结局数据加载失败:没有"verify"这个函数 分析流程全部完成!结果保存在:D:/R_Project/MR_ALL/PILIANG2/YANZHENG/MR_Results
05-26
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值