使用SnpEff 对SNP结果进行分析

本文介绍了如何使用SnpEff工具对小麦基因组的SNP数据进行注解和效果预测,详细阐述了从安装、配置到执行的步骤,并提到了输出文件的解析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants on genes

详细的说明请阅读:

http://snpeff.sourceforge.net/SnpEff_manual.html

一, 安装:

首先在家目录下, 下载安装包

wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip

然后进行解压

unzip snpEff_latest_core.zip

会产生一个snpEff目录 所有的程序都在这里面

二, 配置自己的基因组和注释文件

使用IWGSCv1.0参考基因组,命名为IWGSCv1.0.fa

基因组注释文件使用IWGSCv1.0释放的:

iwgsc_refseqv1.0_HighConf_2017Mar13.gff3

iwgsc_refseqv1.0_LowConf_2017Mar13.gff3

将上述两个文件合并成名为genes.gff 的文件。注意一定要是这个名字!!!

准备好上述文件之后

首先编辑配置文件࿰

### 解析和理解 SnpEff 注释输出的结果 #### VCF 文件中的 ANN 字段解释 VCF (Variant Call Format) 是一种标准的文本文件格式,用于存储基因型信息以及与之相关的元数据。当使用 SnpEff 进行注释后,在原有的 VCF 输出文件上增加了 `ANN` 标签[^1]。此标签包含了关于变异对编码序列影响的信息。 #### ANN 字段结构说明 根据官方文档描述[^3],`ANN` 字段采用特定格式来表示每一个可能的效果及其属性: - **Allele**: 变异等位基因。 - **Annotation**: 描述该变异所造成的影响类别(如 missense_variant, stop_gained 等)。 - **Annotation_Impact**: 影响程度分类(MODIFIER, LOW, MODERATE 或 HIGH),反映了潜在的功能重要性和临床意义。 - **Gene_Name**: 基因名称。 - **Gene_ID**: 数据库中对应的唯一标识符。 - **Feature_Type**: 特征类型(通常是 transcript 或 regulatory_region)。 - **Feature_ID**: 转录本或其他特征的具体 ID。 - **Transcript_BioType**: 生物学特性(coding 或 non-coding RNA 类型)。 - **Rank**: 如果有多个转录版本,则给出当前记录在整个列表里的位置。 - **HGVS.c/HGVS.p**: 使用 HGVS 表达方式分别指代 cDNA 和蛋白质水平上的变化情况。 - **cDNA_pos/cDS_pos/Protein_pos**: 提供相对于整个 mRNA 序列的位置坐标。 - **Distance_to_Feature**: 当变异发生在非编码区时,距离最近功能元件的距离;如果是内含子内的改变则为空白。 ```plaintext Format: Allele | Annotation | Annotation_Impact | Gene_Name | Gene_ID | Feature_Type | Feature_ID | Transcript_BioType | Rank | HGVS.c | HGVS.p | cDNA_pos | CDS_pos | Protein_pos | Distance_to_Feature Example: A|missense_variant|MODERATE|BRCA2|ENSG00000139618|transcript|ENST00000380152|protein_coding|1/27|c.45delC|p.Leu15fs|45|-|- ``` #### 实际应用案例演示 为了更好地展示如何处理经过 SnpEff 处理过的 VCF 文件,可以参考项目自带的例子脚本 examples.sh 中的内容[^5]。这里不仅展示了不同类型的样本数据集,还给出了具体的执行指令,使得初学者能够快速入门并掌握基本操作方法。 #### 工具优势概述 作为一款专为 SNP 结果分析设计的强大工具,SnpEff 不仅能有效地标注出各类遗传变异带来的后果,而且支持多种物种数据库查询,极大地提高了研究效率和准确性[^4]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值