
GWAS
文章平均质量分 76
穆易青
用大模型思维颠覆传统学习生信路径
展开
-
2025.03.14【读书笔记】|GCTA工具概述
GCTA(Genome-wide Complex Trait Analysis)工具是一种用于全基因组关联研究(GWAS)的统计框架,是由西湖大学杨剑(Jian Yang)实验室开发的,它能够帮助我们评估遗传变异对复杂性状影响的重要性。本文将详细介绍GCTA工具的使用方法和在生物信息学研究中的应用。GCTA简介GCTA是一个开源软件包,主要用于基于基因组数据的遗传关联分析。它能够计算样本间的亲缘关系矩阵,进行主成分分析(PCA),并估计遗传力(Heritability)。原创 2025-03-14 15:08:17 · 870 阅读 · 0 评论 -
2025.03.14【读书笔记】|GWAS分析神器:BOLT-LMM工具介绍与快速安装
在生物信息学领域,全基因组关联分析(GWAS)已成为揭示遗传与疾病关系的强有力工具。BOLT-LMM作为一款专为大规模样本量设计的GWAS分析工具,将极大地提高研究人员的工作效率。大家好,今天我们来聊聊一个非常强大的生物信息学工具——BOLT-LMM。它是基于线性混合模型(LMM)的全基因组关联分析(GWAS)分析工具,通过快速的方差近似方法在计算效率上实现了显著的提升。BOLT-LMM的高效性能使其成为大规模样本GWAS分析的理想选择,它将进一步推动生物信息学和遗传学研究的发展。原创 2025-03-14 14:47:20 · 398 阅读 · 0 评论 -
2022.11.21【bug笔记】|bam文件报错:Cannot add sequence that already exists in SAMSequenceDictionary
sam文件是通过hisat2,bowtie2或者bwa将rawdata进行比对后得到的包含比对信息的数据格式。经过samtools处理后得到的bam文件经常用于后续分析,比如RNA-seq分析时,可以统计序列的插入片段也可以做后续定量,WGS流程里比对后生产的bam文件也可以去冗余获取snp位点。原创 2022-11-21 17:23:36 · 784 阅读 · 3 评论 -
2021.07.30【WGS/GWAS】丨全基因组分析全流程(上)
目录摘要命令行三级目录摘要时隔半年,终于把WGS前面的分析用snakemake搭建好了。读者不要嫌我慢,确实是项目不多,流程也不算特别复杂。之前的shell脚本也能用,因此迟迟没有真正搭建。现在项目慢慢多了,考虑到提升工作效率,趁着前几天做了2个WGS的项目,把这个流程梳理出来。命令行#vim: set syntax=python#__author__ = "Yang Xin"#__copyright__ = "Copyright 2021, Wang lab"#__email__ = "4原创 2021-07-30 17:05:54 · 4735 阅读 · 5 评论 -
2020.11.20丨使用GATK CombineGVCFs命令批量合并vcf文件
GATK是一款强大的数据处理软件,最近在优化GWAS流程时遇到一个麻烦事,就是要将各样品的VCF文件进行合并,本来GATK里面有一个可以合并VCF数据的命令 CombineGVCFs,可以将所有样品的VCF合并成一个文件。但是这个命令需要一个一个输入文件名。 熟悉GWAS的小伙伴应该清楚,GWAS项目动辄上百个样品,让人一个一个输入还是很繁琐的。因此我写了个shell脚本,能够快速输入样品名称,并执行CombineGVCFs命令。 脚本 Ref_genome="genome.fna"原创 2020-11-20 15:20:18 · 12971 阅读 · 12 评论 -
2020.11.9【WGS/GWAS】丨全基因组分析(关联分析)全流程(下)
经过为期半个月的~~东拼西凑~~ 研发测试,作者终于整理出了一个从VCF开始的GWAS后期分析流程。当然要感谢很多大佬提供的~~代码~~ 帮助,在文章中也附上参考链接。对GWAS还不够熟悉的朋友,可以看一下我之前整理的一份PPT学习笔记[《遗传进化与GWAS研究》](https://blog.youkuaiyun.com/yangl7/article/details/108486232)。原创 2020-11-09 14:36:28 · 18126 阅读 · 10 评论 -
2020.10.28【GWAS】丨SnpEff工具对SNP进行注释的使用方法
本篇代码参考了简述作者:LiuYueRR 的snpeff使用文档,下面对注释过程进行复盘1.1安装snpEff方法conda install snpeff可以很快捷自动安装,不过,我们在使用snpeff时,需要用到安装包的路径,我是使用miniconda进行安装的,如果大家也是使用miniconda,那么路径应该为/home/username(每个人不一样)/miniconda3/pkgs/snpeff-5.0-0/share/snpeff-5.0-0。2.1构建SnpEff数据库S.原创 2020-10-28 17:11:10 · 6366 阅读 · 4 评论 -
2020.10.27【GWAS】丨使用vcftools绘制pi(θπ) 选择消除分析图
这两天在整理GWAS流程,发现绘制θπ选择消除分析图在网上只能找到计算π的代码,但是没有绘图代码,于是自己搞了一下,供大家参考。vcftools --vcf AxiomGT1.calls.vcf --window-pi 1000 --window-pi-step 1000 --out GT1_pi生成两个文件GT1_pi.windowed.piGT1_pi.log使用GT1_pi.windowed.p文件通过R进行绘图library(ggplot2)data<-read.原创 2020-10-27 23:58:38 · 8797 阅读 · 2 评论 -
2020.10.26丨Error: Invalid chromosome code ‘27‘ on line 46287 of .map file. Plink报错解决方法
通过gatk获得vcf文件后,对SNP位点进行分析前,需要通过plink将vcf文件转换成ped/map,以及bed文件,方便后期进行分析 使用Plink对vcf文件进行转换 运行代码 plink --file GT1 --make-bed --out GT1_test --noweb 报错 图示 我测试的数据是虹鳟鱼,染色体有29对,plink默认是人类染色体(23对) 第一次尝试解决 搜索发现,plink有个--allow-extra-原创 2020-10-26 17:05:07 · 3301 阅读 · 5 评论 -
2020.10.26【GWAS】丨Admixture群体结构分析detected that all genotypes are missing for a SNP locus解决办法
群体遗传结构(Structure)指遗传变异在物种或群体中的一种非随机分布。按照地理分布或其他标准可将一个群体分为若干亚群,处于同一亚群内的不同个体亲缘关系较高,而亚群与亚群之间则亲缘关系稍远。群体结构分析有助于理解进化过程,并且可以通过基因型和表型的关联研究确定个体所属的亚群。一般进行群体分析所使用的软件为STRUCTURE,但是STRUCTURE的运行速度较慢,如今Admixture凭借其高速的运算速度逐渐成为群体遗传结构分析的主流软件。目前市面上看到的官方下载网站已经停止维护,我这里有个低版...原创 2020-10-26 10:50:23 · 3306 阅读 · 0 评论 -
2020.10.21【转载】丨GWAS全基因组关联分析流程
我梳理了GWAS全基因组关联分析的整个流程,并提供了基本的命令,用到的软件包括BWA、samtools、gatk、Plink、Admixture、Tassel等,在此分享出来给大家提供参考。一、BWA比对1.构建索引bwa index -a is example.fasta #构建索引 -a is算法 (BWT构造算法:bwtsw、is或rb2)2.进行比对bwa mem -t 6 -R '@RG\tID:foo\tPL:Illumina\tSM:example' exampl转载 2020-10-21 15:25:03 · 5383 阅读 · 0 评论