sta@ma@brain
从事核磁共振脑科学研究,在Nature communications等权威期刊发表磁共振相关研究成果。熟练掌握磁共振成像数据处理方法(T1w, fMRI, dWI)和统计检验方法。本博客以记录学习中的点滴,着重记录从影像数据处理软件安装,数据处理步骤,以及分析方法(图论,矩阵理论,统计检验方法,回归分析,机器学习等),希望对志同道合的有一定的帮助。
展开
-
R语言如何绘制雷达图,radarchart包的使用
先看一下效果图论文里面一般展示雷达图如下下面我们使用fmsb包中的radarchart函数需要一个数据,其中第一行代表数据的最大值(10),第二行代表数据的最小值(0)。否则,需要设置maxmin = FALSE。注意,列数必须大于2。每一列是一个变量,行表示组。在df中我们只有一组和8个不同的变量。Data set with one groupset.seed(1)df <- data.frame(rbind(rep(10, 8), rep(0, 8),原创 2022-05-05 21:59:53 · 1327 阅读 · 2 评论 -
如何用python画下三角矩阵的相关热力图?sns.heatmap详解
python如何绘制下三角矩阵的热力图,先看一下效果图加载必要的包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport scipy.stats as stats from matplotlib.ticker import FormatStrFormatterencoding="utf-8"加载数据#读取数据data = pd.read_excel原创 2022-04-30 07:00:00 · 2480 阅读 · 0 评论 -
做相关性分析时,如何排除奇异值Outliers,以增加相关分析的准确性
如下图所示,如何排序奇异值,以提高性两者之间的相关性。思想: 为了提高相关性分析,我们通过从双变量平均值中为每个观察值求马氏距离来识别异常值,并排除平均 马氏距离 为 6 或更大的所有点。代码下载地址:做相关性分析时,如何排除奇异值Outliers,以增加相关分析的准确性Rousselet 和 Pernet (2012) 证明异常值可以扭曲 Pearson 相关性。他们声称,通过选择和重新分析一组已发表的研究,这会导致广泛的统计错误。然而,他们既没有报告这项调查的研究身份,也没有报告纳入标准,因此他原创 2022-04-21 21:17:26 · 1037 阅读 · 0 评论 -
如何使用Colormaps和自定义自己喜欢的colorbar?
在做图时,总是觉得自己的配色很差,这怎么办呢?下面,我将介绍如何使用Python自带的Colormaps,和自定义自己想要的colorbar.Python自带的colorbarPython有非常丰富的颜色图,比如下面的网站, 请访问Choosing Colormaps in Matplotlib 上面有比较多的colorbar。比如如何获取python的颜色比如我们需要图里面的RdBu颜色图应该如何操作呢?我们首先需要在python中得到我们需要的颜色图的矩阵数据import numpy原创 2022-04-21 20:18:54 · 1292 阅读 · 0 评论 -
R语言绘制小提琴图geom_violin,如何添加额外的点geom_point?geom_violin + geom_boxplot + geom_point组合使用
下面展示的是Yeo 7网络的梯度分布,并添加额外的点(红色三角形)的小提琴图,先看一下效果图第一步:先加载R语言包rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)library(ggridges)第二步:加载数据#加载数据network_mean_gradient <- read.csv('E:\\R_Code\\plot_heat_map\\data\\networ原创 2022-04-21 19:53:12 · 1760 阅读 · 5 评论 -
R语言绘制小提琴图geom_violin,如何给每个小提琴添加自定义直线?
R语言绘制小提琴图geom_violin,如何给每个小提琴添加自定义直线?效果如下图所示:数据按照下面的方式进行存储下面提供所需要的代码:#加载必要的包rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)#首先读取数据##加载数据melted_df<- read.csv('E:\\R_Code\\plot_heat_map\\melted_df.csv', head原创 2022-04-02 22:47:29 · 1313 阅读 · 0 评论 -
R语言绘制山脊图 ggridge,如何给每个山脊添加自定义垂直线?
我们在用library(ggridges)画山脊图时,经常会遇到一个问题,怎么修改填充颜色,怎么添加一条垂直竖线,下面给出详细解答。上图的代码如下:rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)library(ggridges)#自定义每个类别的填充颜色colors <- c("#FF6600", "#31A354", "#0000FF") ggplot原创 2022-03-30 21:01:44 · 1187 阅读 · 0 评论 -
回归分析中,简述几种残差的定义?性质?作用以及特点?
回归分析中常用的残差有普通残差,学生化残差,删除残差,删除学生化残差。下面给出这几种残差的定义,性质,作用和特点。回归分析的几种残差定义和性质回归分析中回归诊断的主要内容普通残差学生化残差删除残差删除学生化残差回归分析中回归诊断的主要内容普通残差普通残差 residuals:实际观察值与估计值(拟合值)之间的差。超过正负 3 个 标准差范围的残差为异常值。性质: ei=yi−y^i=(I−H)Y,ei∼N(0,1)e_{i}=y_{i}-\hat{y}_{i}=(I-H) Y, \mathrm{原创 2022-03-27 10:54:19 · 7365 阅读 · 0 评论 -
脑科学统计方法总结
1 假设检验假设检验是指母体上做出某项假设,从母体随机的抽取一个子样,用它检验此项假设是否成立。在母体上的假设可分为两类:(1)对母体分布的参数做出某项假设,一般是对母体的数字特征作一项假设,用母体中子样检验此项假设是否成立,称这一类为参数假设检验。(2)对母体分布作某项假设,用母体中子样检验此项假设是否成立,称这一类为分布假设检验。下面重点总结在脑科学中常用的参数检验方法——t检验。t检验(t-test)又称学生t检验(Student t-test)可以说是统计推断中非常常见的一种检验方法,用于统原创 2022-02-14 21:34:31 · 1034 阅读 · 0 评论 -
Ubuntu系统下MRIcroN、FSL6.0.5、Freesurfer7.1.1、ANTs、MRtrix3、AFNI的安装详解——核磁共振数据处理必备
Ubuntu系统下MRIcroN、FSL6.05、Freesurfer7.1.1、MRtrix3、AFNI、ANTs的安装详解一、安装MRIcroN二、 FSL6.0.5完整安装与FSLeyes等Not Found修复Anaconda与虚拟环境(所有操作均在root下)获取最新版Anaconda3安装Anaconda3配置所有用户可用去掉恼人的base创建虚拟环境FSL与FSLeyes安装(所有操作均在root下)下载FSL安装FSL添加环境变量到/etc/bash.bashrc末尾 (ubuntu)或者原创 2021-10-04 20:56:20 · 5095 阅读 · 0 评论 -
corrplot和ggcorrplot画热力图
corrplot的基础用法和指南corrplot包主要针对相关系数输出的结果进行可视化,可以实现选择颜色,文本标签,颜色标签,布局等的操作。语法和常用参数介绍函数语法corrplot(corr, method = c("circle", "square", "ellipse", "number", "shade", "color", "pie"), type = c("full", "lower", "upper"), add = FALSE, col = NULL, bg = "white"转载 2021-09-21 10:19:24 · 1026 阅读 · 0 评论 -
R语言绘图——组间差异箱线图图,小提琴图、聚类热力图、相关系数热力图
生物医学工程常用图箱线图:使用ggboxplot()函数来展示数据在多组间的差异小提琴图:使用ggviolin()函数来展示数据在多组间的比较热力图:pheatmap()展示聚类热图反映数据在多样本间的差异表达情况相关系数热力图:corrplot绘制相关系数图来展示数据间的相关性~相关性分析图:ggMarginal()绘制相关性分析图注:本文摘自于公众号:科研生信充电宝,R语言50绘图|50期R语言绘图汇总大合集箱线图:使用ggboxplot()函数来展示数据在多组间的差异在做图时:一般需要根据及以原创 2021-08-29 21:51:30 · 5366 阅读 · 4 评论 -
结构MRI、静息态MRI(fMRI)、任务态fMRI、MEG、EEG公开数据库汇总
(1)人脑连接组计划(HCP),该数据库目前被试数约1200人,包括结构MRI、静息态MRI、任务态fMRI、MEG等数据模态,其他数据还包括人口统计学数据、神经心理学数据、基因数据。网址:http://www.humanconnectome.org/(2)1000功能连接组计划(1000 Functional Connectomes Project, FCP),包括结构MRI和静息态fMRI数据,此外还包括人口统计学数据。网址:http://fcon_1000.projects.nitrc.org/转载 2021-08-01 16:45:19 · 6709 阅读 · 1 评论 -
偏最小二乘回归分析原理详解和案例分析实例
偏最小二乘回归分析原理详解背景偏最小二乘回归分析 Partial least squares regression analysis基本思想建模步骤步骤一:分别提取两变量组的第一对成分,并使之相关性达最大步骤二:建立 y1,⋯ ,yp\boldsymbol{y}_{1}, \cdots, \boldsymbol{y}_{p}y1,⋯,yp 对 u1\boldsymbol{u}_{1}u1 的回归及 x1,⋯ ,xm\boldsymbol{x}_{1}, \cdots, \boldsymbol{x}_{原创 2021-07-25 11:18:35 · 9428 阅读 · 6 评论 -
Matlab偏最小二乘回归命令plsregress详解
Matlab偏最小二乘回归命令plsregressMatlab工具箱中偏最小二乘回归命令plsregress的使用格式为[XL,YL,XS,YS,BETA,PCTVAR,MSE,stats] = plsregress (X,Y,ncomp)其中输入值为:X,Y,ncompX\mathrm{X}X 为 n×m\mathrm{n} \times \mathrm{m}n×m 的自变量数据矩阵, 每一行对应一个观测,每一列对应一个变量;Y\mathrm{Y}Y 为 n×p\mathrm{n} \tim原创 2021-07-25 11:17:03 · 4498 阅读 · 12 评论 -
图信号非参数假设检验:一种生成代替图信号的谱方法——A Spectral Method for Generating Surrogate Graph Signals
本文利用图的傅里叶变换定义了一种生成代理图信号的新方法。该方法是基于图傅里叶系数的符号随机化,因此,代理图信号的相关结构(即图拓扑上的平滑性)是由测量数据强加的。所提出的替代数据生成方法可广泛应用于非参数统计假设检验。在将测量的图信号转换到谱图域后,我们通过随机化来置换或随机生成图傅里叶(GFT) 系数 c 的符号。 接下来,逆 GFT 提供了替代图信号的实现。 相位随机化的等效图保留了 GFT 系数的幅度,并有效地强加了通过图拉普拉斯算子定义的代理自相关。 具体来说,在零假设下,测量的图形信号被假定为具原创 2021-07-17 16:59:04 · 208 阅读 · 0 评论 -
互信息介绍及MATLAB代码实现
互信息(Mutual information): 一种量化两个随机变量的非线性依赖性的信息理论度量方法First, we evaluate the similarity between each connectome harmonic and each of the 7 resting state networks using mutual information, an information theoretical measure quantifying the non-linear dependen原创 2021-07-17 16:43:58 · 2535 阅读 · 6 评论 -
一文秒懂图卷积神经网络Graph Convolutional Network(GCN)——从图信号处理(GSP)到图卷积神经网络详细推导
参考资料:对卷积的理解和物理意义图卷积网络 GCN Graph Convolutional Network(谱域GCN)的理解和详细推导【GNN】万字长文带你入门 GCN【Code】关于 GCN,我有三种写法githup地址,代码,论文总结和推荐如何理解 Graph Convolutional Network(GCN)?——清华大学博士解读...原创 2021-07-09 20:09:42 · 958 阅读 · 3 评论 -
一文读懂张量分解(展开)和Matlab实现
张量展开(tensor unfolding)是张量计算的重要组成部分,有时候,为了简化计算,将高阶张量展开成矩阵是非常有必要的。然而,由于高阶张量的这种“矩阵化”(matricization)过程比较抽象,因此,张量展开往往被视为张量计算的一大理解障碍。1. 什么是张量?为方便理解后面的张量展开,我们先看看什么是张量(X∈Rn1×n2×⋯×nd\mathcal{X} \in \mathbb{R}^{n_{1} \times n_{2} \times \cdots \times n_{d}}X∈Rn1×翻译 2021-06-27 15:58:28 · 3372 阅读 · 0 评论 -
什么是结构因果模型
结构因果模型结构因果模型简介定义历史因果关系之梯关联干预反事实因果因果和相关类型必要因充分因促成因模型因果图模型元素连接方式链叉对撞节点类型中介变量混杂因子工具变量孟德尔随机化关联独立性条件混杂/去混杂后门调整前门调整 Frontdoor Adjustment干预查询Do演算do演算规则集版本1版本2版本3扩展反事实潜在结果 Potential Outcome因果推断计算反事实 Conducting a counterfactual归因 Abduct行动 Act预测 Predict中介Mediation直接转载 2021-06-26 21:47:17 · 8742 阅读 · 0 评论 -
详解幂律分布,以及用于重尾分布的Python库powerlaw的使用
详解幂律分布,以及用于重尾分布的Python包powerlaw总述幂律分布简要回顾powerlaw库拟合效果powerlaw库基本操作介绍可视化拟合范围离散与连续数据与其他分布比较总述具有长尾特征的分布往往一目了然,但实际拟合过程却可能遇到各种各样的问题。本文将为读者介绍2014年由新加坡科技设计大学和麻省理工研究者联合发布的python库:powerlaw,专门适用于幂律等长尾特征分布的拟合,解决拟合烦恼。期刊来源:PLOS ONE论文标题:powerlaw: A Python Package翻译 2021-06-22 09:42:44 · 3818 阅读 · 2 评论 -
三大相关系数:Pearson、Spearman秩相关系数、kendall等级相关系数的联系与区别
三大统计相关系数:Pearson、Spearman秩相关系数、kendall等级相关系数统计相关系数简介Pearson(皮尔逊)相关系数1、简介2、适用范围3、使用方法Spearman Rank(斯皮尔曼等级)相关系数1、简介2、适用范围3、使用方法Kendall Rank(肯德尔等级)相关系数1、简介2、适用范围3、使用方法联系与区别统计相关系数简介相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:(1)、当相关系数为原创 2021-05-25 14:22:00 · 5077 阅读 · 3 评论 -
最全总结Python 第三方库安装方法
下面将自己学习过程中总结的Python第三方库的安装常用三种方法分享给大家,本人推荐前面两种方式。(已安装Python)方法一:pip命令行直接安装打开cmd命令窗口,通过命令 pip install 包名 进行第三库安装,此方法简单快捷,示例安装keras库。 注意:安装成功会显示Successfully installed keras,如果出现黄色字体警告,是由于pip库包不是最新的,但keras库已成功安装,可随后对pip包进行更新,更新命令: python -m pip install转载 2021-05-13 15:13:40 · 9727 阅读 · 0 评论 -
matlab画图总结——二维图plot函数、图形标注和坐标轴控制、饼图、条形图、排列图;三维图的绘制
Matlab画图总结1. 二维数据曲线图1.1 绘制二维曲线的基本函数1.plot()函数2. 含多个输入参数的plot函数3. 含选项的plot函数4. 双纵坐标函数plotyy1.2 绘制图形的辅助操作1.图形标注2. 坐标控制1.3 绘制二维图形的其他函数1.对数坐标图2. 饼图3. 条形图4. 排列图2. 三维图形2.1 绘制三维曲线1.用plot3()函数画三维曲线2. 三维网格图的绘制2.2 三维表面图的绘制2.3 三维切片图的绘制1. 二维数据曲线图1.1 绘制二维曲线的基本函数1.pl转载 2021-05-11 21:22:16 · 18000 阅读 · 0 评论 -
生物医学统计方法总结
来源:https://mp.weixin.qq.com/s/WH4aZ75Q_UVy5w8fCbG2ig原创 2021-05-10 15:59:41 · 821 阅读 · 0 评论 -
生物医学中常用的假设检验总结——正态性检验、t检验、方差分析、秩和检验、卡方检验
医学中常用的假设检验总结1 医学中常用的假设检验总结1.1 正态性检验1.2 方差齐性检验1.3 t 检验1.4 方差分析1.5 卡方检验1.6 秩和检验1 医学中常用的假设检验总结1.1 正态性检验Shapiro-Wilk正态检验方法来检验样本是否符合正态分布:shapiro.test(x) # 正态性检验,p-value 大于0.05时为正态分布1.2 方差齐性检验① Bartlett检验,适用于正态分布数据;数据非正态时则容易导致假阳性bartlett.test(V~Group原创 2021-04-11 17:51:15 · 5854 阅读 · 1 评论 -
R语言绘制散点图和边际图(柱形图,小提琴图)
ggplot2 + ggExtra绘制边际散点图原创 2021-04-11 16:49:53 · 2223 阅读 · 2 评论 -
R语言做统计检验绘图如何添加p-value和显著性标记?——详细介绍如何通过ggpubr包为ggplot图添加p-value以及显著性标记?
R语言做统计检验绘图如何添加p-value和显著性标记?——详细介绍如何通过ggpubr包为ggplot图添加p-value以及显著性标记?原创 2021-04-05 21:57:42 · 4915 阅读 · 3 评论 -
方差分析时,如何搞定方差分析、盒型图、显著性标记?——以Graphpad Prism 8.0为例
方差分析时,如何搞定方差分析、盒型图、显著性标记?——以Graphpad Prism 8.0为例原创 2021-04-05 21:22:02 · 6113 阅读 · 0 评论 -
R语言详解参数检验和非参数检验——样本T检验、方差分析、pearson相关性检验、单样本wilcoxon检验、Mann-Whitney检验、配对样本wilcoxon检验、列联表检验、卡方检验
R语言详解参数检验和非参数检验二、参数检验R语言实现2.1 单样本t检验2.2 独立样本t检验2.3 配对样本t检验2.4方差分析2.5 pearson相关性检验三、非参数检验R语言实现3.1单样本wilcoxon检验3.2 Mann-Whitney检验3.3配对样本wilcoxon检验3.4 Kruskal-wallis和置换多元方差分析检验3.5 spearman相关性检验四、列联表检验(定性资料)4.1 pearson卡方检验4.2 Fisher精确检验4.3 Cochran-Mantel–H原创 2021-04-05 20:19:11 · 5325 阅读 · 4 评论 -
实际问题中提出一个检验统计量,如何确定其分布?
原创 2021-03-13 22:58:26 · 565 阅读 · 2 评论 -
模拟产生2组(每组1000个)独立的[0,1]上均匀分布的随机数,求和并画出数据的直方图,观察结果是否仍是均匀分布?产生12组求和的结果?
本题验证均匀分布是否具有可加性和模拟中心极限定理。利用函数runif()产生随机数,其中min=0, max=1表示均匀分布的区间。其模拟1000个均匀分布随机数如图9所示,2组均匀分布随机数相加如图10所示。从图10可看出,2个均匀分布相加不为均匀分布,其为三角分布。下面给出相应的代码:n <-1000a <- runif(n, min=0, max=1)b <- runif(n, min=0, max=1)par(mfrow=c(2,1)) hist(a,prob=T,mai原创 2021-03-13 22:54:14 · 1235 阅读 · 0 评论 -
模拟100个 正态分布的随机数,计算其样本均值和样本方差,观察其余真实值的差异。当增大样本容量时,其差异有何规律。
用R软件随机模拟产生6组均值为5,方差为100的随机数,其样本个数分别设为100,1000,10000,100000,1000000,10000000,100000000。观察各组数据的样本方差和样本均值的差异。下面给出模拟程序:n <- c(100,1000,10000,100000,1000000,10000000,100000000)for(i in 1:length(n)){ mean01[i] <- mean(rnorm(n[i], mean=5, sd=10)) var0原创 2021-03-13 22:50:40 · 4017 阅读 · 0 评论 -
如果你构造了一个统计量其分布不容易确定,如何通过实验的方法给出其相应分布的分位数?
如果你构造了一个统计量其分布不容易确定,如何通过实验的方法给出其相应分布的分位数?原创 2021-03-13 22:46:42 · 197 阅读 · 0 评论 -
收集整理1-2个自己熟知的假设检验问题,并给出检验统计量的分布。
收集整理1-2个自己熟知的假设检验问题,并给出检验统计量的分布。原创 2021-03-13 22:43:05 · 393 阅读 · 0 评论 -
构造原理中的独立性条件如果不满足,是否原结论仍然成立?试用模拟的方法验证你的结论。
构造原理中的独立性条件如果不满足,是否原结论仍然成立?试用模拟的方法验证你的结论。原创 2021-03-13 22:33:57 · 302 阅读 · 0 评论 -
详解高斯过程回归和核贝叶斯线性回归
详解高斯过程回归高斯过程回归核贝叶斯线性回归函数空间的观点高斯过程回归将一维高斯分布推广到多变量中就得到了高斯网络,将多变量推广到无限维,就得到了高斯过程,高斯过程是定义在连续域(时间空间)上的无限多个高维随机变量所组成的随机过程。在时间轴上的任意一个点都满足高斯分布吗,将这些点的集合叫做高斯过程的一个样本。对于时间轴上的序列 ξt\xi_tξt,如果 ∀n∈N+,ti∈T\forall n\in N^+,t_i\in T∀n∈N+,ti∈T,有 ξt1−tn∼N(μt1−tn,Σt1−tn)原创 2021-01-02 13:21:19 · 2050 阅读 · 0 评论 -
详解回归分析中相关变量选择的方法和构建思想——岭回归、LASSO 回归、主成分回归和偏最小二乘回归
在线性回归模型中,其参数估计公式为 $\beta=\left(X^{T} X\right)^{-1} X^{T} y,$ 当 $X^{T} X$ 不可逆时无法求出 $\beta,$ 另外,如果 $\left|X^{T} X\right|$ 越趋近于 $0,$ 会使得回归系数趋向于无穷大, 此时得到的回归系数是无意义的。解决这类问题可 以使用岭回归、LASSO 回归、主成分回归、偏最小二乘回归, 主要针对自变量之间存在多重共线性或者自变量个数多于样本量的情况。原创 2020-12-26 13:09:12 · 2210 阅读 · 0 评论 -
统计学中假设检验有关P值的讨论
摘要:统计检验能有效确定从样本统计推断至总体时所犯错误的概率,其在医学、临床试验。观察性研究方面有着重要意义。近年来期刊编辑和统计顾问越来越关注医学文献中显着性检验和P值的过度使用和误解。为了澄清对统计学检验和P值的误解和误用,本文通过回顾P值相关理论,总结了P值的优势和劣势,强调了P值在使用中应注意的问题,旨在使非统计专业人员避免对P值的误解和误用。关键词:P值;假设检验;置信区间原创 2020-12-25 09:21:32 · 1704 阅读 · 0 评论 -
最全numpy100道练习题
这是python中数据分析必备模块——numpy的100道练习题,原文地址为:numpy100numpy练习题1. Import the numpy package under the name `np` (★☆☆)2. Print the numpy version and the configuration (★☆☆)3. Create a null vector of size 10 (★☆☆)4. How to find the memory size of any array (★☆☆)5. H原创 2020-12-21 09:58:49 · 1575 阅读 · 0 评论