自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 1000genome(1KG)----GWAS分析神器

筛选比对到hg19(GRCh37)的高深度测序的中国样本(不包含傣族)使用的关键词:CHB, CHS, Phase 3, High cov WGS。1000G是按阶段实施的,主要包括4个阶段的数据,pilot, phase1, phase2, phase3;其包含的个体是来自不同人群(如欧美、亚洲等)的健康对照样本,可以很方便的下载到原始数据,在缺乏对照研究时可以作为很好的对照。同样,GRCH38的不同版本(GRCH38.p1, GRCH38.p2等)是对GRCH38的修补(patch),坐标系不会改变。

2024-12-11 14:43:02 1085

原创 孟德尔随机化T我SampleMR

mr(dat,method_list = c("mr_ivw","mr_egger_regression","mr_weighted_median"))#选择所用的MR方法。原文链接:https://blog.youkuaiyun.com/qq_43872123/article/details/132853873。剔除F值<10的SNP。1、暴露数据和结局数据的SNO所对应的效应等位基因不一致(A/G vs. G/A)?setwd("D:/Software/R/projects/MR")#设置工作路径。

2024-12-09 19:34:50 286

原创 R数据分析:孟德尔随机化实操

好多同学询问孟德尔随机化的问题,我再来尝试着梳理一遍,希望对大家有所帮助,首先看下图1分钟,盯着看将下图印在脑海中:上图是工具变量(不知道工具变量请翻之前的文章)的模式图,明确一个点:我们做孟德尔的时候感兴趣的是x和y的关系,也就是小b,但是我们直接去跑x对y的回归肯定是不对的,因为有很多的U,因此我们借助工具变量G(关于工具变量我们之前的文章有详细的解释,请自行查阅),去估计我们感兴趣的小b。

2024-11-07 18:36:05 2241 1

原创 全基因组关联分析(GWAS)-统计方法与模型简介

是对多个个体在全基因组范围的遗传变异(标记)多态性进行检测,获得基因型,进而将基因型与可观测的性状,即表型,进行群体水平的统计学分析,根据统计量或显著性 p 值筛选出最有可能影响该性状的遗传变异(标记),挖掘与性状变异相关的基因。当位于某一座位的特定等位基因与另一座位的某一等位基因同时出现的概率大于群体中因随机分布的两个等位基因同时出现的概率时,就称这两个座位处于连锁不平衡状态(linkage disequilibrium)• 令Yi为第i个个体的质量性状的表型值Yi = {0,1};

2024-11-01 16:15:20 2077

原创 有相关性就有因果关系吗,教你玩转孟德尔随机化分析

流行病学研究常见的分析就是相关性分析了。相关性分析某种程度上可以为我们提供一些研究思路,比如缺乏元素A与某种癌症相关,那么我们可以通过补充元素A来减少患癌率。这个结论的大前提是缺乏元素A会导致这种癌症,也就是说元素A和癌症有因果关系。但实际上,。也有可能是患癌症的人同时有其他的并发症,这种并发症会导致元素A缺乏。再比如,研究表明,大胸女生与不爱运动相关。那么,到底是因为胸大的女性不爱运动,还是因为不爱运动导致胸大(肥胖)。

2024-09-27 14:29:37 982

原创 讲一讲孟德尔随机化分析中的敏感性分析(sensitivity analyses)

敏感性分析定义:敏感度分析是研究数学模型或系统(数值或其他)输出中的不确定性如何在其输入中被分配到不同的不确定性来源 ——摘自维基百科。我知道这段拗口的定义让人看了,感觉跟没看一样。所有的文字都认识,但是连起来就读不懂是什么意思了。所以我直白的翻译一下,敏感性分析就是通过一些手段鉴定结果是否靠谱的一项分析。

2024-09-27 14:18:35 738

原创 讲一讲孟德尔随机化分析中的敏感性分析(sensitivity analyses)

敏感性分析定义:敏感度分析是研究数学模型或系统(数值或其他)输出中的不确定性如何在其输入中被分配到不同的不确定性来源 ——摘自维基百科。我知道这段拗口的定义让人看了,感觉跟没看一样。所有的文字都认识,但是连起来就读不懂是什么意思了。所以我直白的翻译一下,敏感性分析就是通过一些手段鉴定结果是否靠谱的一项分析。

2024-09-27 14:17:49 725

原创 post-GWAS:使用coloc进行共定位分析(Colocalization)

GWAS找到显著信号位点后,需要解释显著信号位点如何影响表型。常见的一个解释方法是共定位分析。其中,GWAS和eQTL共定位应用最为广泛。具体来说,当检测到GWAS信号和eQTL共定位时,我们会认为GWAS信号上的位点可能通过改变基因表达的生物学过程影响表型。基于以上四种设想,我们希望第四种设想 H4 在统计学上概率更高,这样就能解释显著信号位点如何影响表型;所以共定位分析,本质上是在检验第四种的后验概率;

2024-09-27 11:29:18 1562

原创 SNP的rsID与位置信息的相互匹配 rsID/ chr:pos conversion

点击submit query后,稍作等待,结果就会显示出来,可以导出为VCF或txt文本格式。(注意某些SNP的rsID有合并等原因,版本不同rsID注释结果不一定相同)因为我们只查询位置信息,就不勾选其他数据库,只使用默认的Ensembl。首先输入用户信息,学术用途是免费的,使用自己的edu邮箱即可。输入文件使用上述的(类bed文件),ex1.avinput。点击输入框下方的example,可以查看可用的输入格式。)查询,查询个别SNP时方便快捷,可以直接搜rsID。

2024-09-03 11:00:06 940

原创 人类参考基因组38版与19版有什么区别?

已有研究表明,GC含量会影响Illumina测序的效率,并影响后续的分析,如CNV的检测,而CNV的检测严重依赖于深度覆盖。文章还指出,GRCh38在基因组分析中的准确性和可靠性的提高,不仅得益于基因组组装的改进,还得益于参考基因组中的多样性。与GRCh37相比,GRCh38改变了8000个bp,纠正了几个错误组装的区域,填补了空白,增加了着丝粒序列,在178个区域组装了261条alternate loci,丰富了基因组的多样性。在检测的24条染色体中,16条GRCh38的核苷酸计数减少,8条增加。

2024-08-31 17:30:10 6730

原创 linux下取消r镜像设置

打开文件,找到并删除或注释掉 `options("repos"= c(CRAN="https://mirrors.pku.edu.cn/CRAN/","http://mirrors.aliyun.com/CRAN"))` 这行。保存后,按 Ctrl+X 退出。4. 保存并退出:在 `nano` 中按 `Ctrl+O` 保存,然后 `Ctrl+X` 退出;1. 打开终端,输入 `nano ~/.Rprofile` 来使用 `nano` 编辑器,或 `vi ~/.Rprofile` 使用 `vi` 编辑器。

2024-08-28 16:27:02 255

原创 linux下ssh命令22端口连接失败

总结起来,当遇到Linux SSH命令无法连接22端口的问题时,你可以检查远程主机上是否启用了SSH服务、防火墙规则是否允许通过、本地主机是否能够访问远程主机的22端口以及网络是否正常运行等。如果你仍然无法连接到远程主机的22端口,可能是由于网络问题引起的。在命令中,将 “user” 替换为你要登录的用户名,将 “remote_host” 替换为远程主机的IP地址或域名。另外,你还需要确保本地主机可以访问远程主机的22端口。如果你使用的是其他防火墙软件,你需要了解如何配置规则以允许SSH连接。

2024-08-08 19:19:59 3797

原创 GCC 指令详解及动态库、静态库的使用方法

GCC 是 Linux 下的编译工具集,是「GNU Compiler Collection」的缩写,包含 gcc、g++ 等编译器。这个工具集不仅包含编译器,还包含其他工具集,例如 ar、nm 等。GCC 工具集不仅能编译 C/C++ 语言,其他例如 Objective-C、Pascal、Fortran、Java、Ada 等语言均能进行编译。

2024-08-03 16:21:26 3199

原创 linux设置r镜像,一劳永逸,R的个性化默认配置

最近因为需要安装ChIPseeker这个R包,需要使用BiocManager进行安装。前言1. 报错内容2. 解决方案3. 安装R包模板3.1 镜像设置3.2 下载方式设置3.3 安装R包4. 永久保存镜像设置后记。为了更方便的安装R包,不用每次都进行设置。这样以后我们一旦打开R软件,这些代码就会自动运行一次,我们就可以愉快的安装R包了。代码语言:javascript。代码语言:javascript。代码语言:javascript。代码语言:javascript。代码语言:javascript。

2024-07-29 16:44:40 817

原创 BiocManager安装R包失败——Bioconductor version cannot be validated

最近因为需要安装ChIPseeker这个R包,需要使用BiocManager进行安装。前言1. 报错内容2. 解决方案3. 安装R包模板3.1 镜像设置3.2 下载方式设置3.3 安装R包4. 永久保存镜像设置后记。为了更方便的安装R包,不用每次都进行设置。这样以后我们一旦打开R软件,这些代码就会自动运行一次,我们就可以愉快的安装R包了。代码语言:javascript。代码语言:javascript。代码语言:javascript。代码语言:javascript。代码语言:javascript。

2024-07-29 16:44:07 2280 1

原创 SNP的rsID与位置信息的相互匹配 rsID/ chr:pos conversion

点击submit query后,稍作等待,结果就会显示出来,可以导出为VCF或txt文本格式。(注意某些SNP的rsID有合并等原因,版本不同rsID注释结果不一定相同)因为我们只查询位置信息,就不勾选其他数据库,只使用默认的Ensembl。首先输入用户信息,学术用途是免费的,使用自己的edu邮箱即可。输入文件使用上述的(类bed文件),ex1.avinput。点击输入框下方的example,可以查看可用的输入格式。)查询,查询个别SNP时方便快捷,可以直接搜rsID。

2024-07-09 09:28:42 2919

原创 GWAS分析数据质控

输入文件前缀:HapMap_3_r3_1(HapMap_3_r3_1.bed HapMap_3_r3_1.bim HapMap_3_r3_1.fam),prune.out两个文件,prune.in文件中包含的就是通过筛选条件我们需要的SNP位点。文件内容为map文件第二列snp名称(唯一标识符)。将其转化为二进制文件:b.bed, b.bim, b.fam。此命令根据列表删除状态为"PROBLEM"的个人。将其转化文件:c.map, c.ped。和正常plink文件类似,除了。将其转化文件:d.vcf。

2024-07-03 10:15:19 948 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除