1. GEMINI简介
GEMINI(Genome Mining)是用于遗传变异分析的生物信息学工具,适用于家系新生突变分析、常染色体显性遗传突变分析、常染色体隐性遗传突变分析、群体分析、成对肿瘤样本分析。通过将 VCF 文件 转换为轻量级数据库(SQLite),查询速度比传统文本处理快10-100倍,预集成ClinVar、dbSNP、gnomAD、CADD等30+种功能/人群数据库,支持高效查询和遗传模式筛选。其核心优势在于结合家系结构信息 ,快速识别符合特定遗传模型的致病突变。
2. 软件安装
官网教程: https://gemini.readthedocs.io/en/latest/content/installation.html
# centos/ubuntu conda安装
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh -b -p $HOME/miniconda3
echo 'export PATH="$HOME/miniconda3/bin:$PATH"' >> ~/.bashrc
source ~/.bashrc
conda init bash
# 创建conda环境
conda create -n gemini python=3.7
conda activate gemini
# 安装gemini
wget https://github.com/arq5x/gemini/raw/master/gemini/scripts/gemini_install.py
# 创建tool和data存储目录
mkdir {
tool,data}
python gemini_install.py tool data
# 查看版本
gemini --version
3. 数据库安装
需下载自带10多个GB的数据库及CADD(39G)和GERP(7G)两个数据库。
# 全套数据库(建议服务器安装)
gemini update --dataonly --extra cadd_score --extra gerp_bp
# 最小化安装(测试用)
gemini update --dataonly --no-cdata
# 下载时中断,恢复下载(支持断点续

最低0.47元/天 解锁文章
2349

被折叠的 条评论
为什么被折叠?



