sta@ma@brain
从事核磁共振脑科学研究,在Nature communications等权威期刊发表磁共振相关研究成果。熟练掌握磁共振成像数据处理方法(T1w, fMRI, dWI)和统计检验方法。本博客以记录学习中的点滴,着重记录从影像数据处理软件安装,数据处理步骤,以及分析方法(图论,矩阵理论,统计检验方法,回归分析,机器学习等),希望对志同道合的有一定的帮助。
展开
-
R语言如何绘制雷达图,radarchart包的使用
先看一下效果图论文里面一般展示雷达图如下下面我们使用fmsb包中的radarchart函数需要一个数据,其中第一行代表数据的最大值(10),第二行代表数据的最小值(0)。否则,需要设置maxmin = FALSE。注意,列数必须大于2。每一列是一个变量,行表示组。在df中我们只有一组和8个不同的变量。Data set with one groupset.seed(1)df <- data.frame(rbind(rep(10, 8), rep(0, 8),原创 2022-05-05 21:59:53 · 1327 阅读 · 2 评论 -
如何用python画下三角矩阵的相关热力图?sns.heatmap详解
python如何绘制下三角矩阵的热力图,先看一下效果图加载必要的包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport scipy.stats as stats from matplotlib.ticker import FormatStrFormatterencoding="utf-8"加载数据#读取数据data = pd.read_excel原创 2022-04-30 07:00:00 · 2480 阅读 · 0 评论 -
做相关性分析时,如何排除奇异值Outliers,以增加相关分析的准确性
如下图所示,如何排序奇异值,以提高性两者之间的相关性。思想: 为了提高相关性分析,我们通过从双变量平均值中为每个观察值求马氏距离来识别异常值,并排除平均 马氏距离 为 6 或更大的所有点。代码下载地址:做相关性分析时,如何排除奇异值Outliers,以增加相关分析的准确性Rousselet 和 Pernet (2012) 证明异常值可以扭曲 Pearson 相关性。他们声称,通过选择和重新分析一组已发表的研究,这会导致广泛的统计错误。然而,他们既没有报告这项调查的研究身份,也没有报告纳入标准,因此他原创 2022-04-21 21:17:26 · 1037 阅读 · 0 评论 -
如何使用Colormaps和自定义自己喜欢的colorbar?
在做图时,总是觉得自己的配色很差,这怎么办呢?下面,我将介绍如何使用Python自带的Colormaps,和自定义自己想要的colorbar.Python自带的colorbarPython有非常丰富的颜色图,比如下面的网站, 请访问Choosing Colormaps in Matplotlib 上面有比较多的colorbar。比如如何获取python的颜色比如我们需要图里面的RdBu颜色图应该如何操作呢?我们首先需要在python中得到我们需要的颜色图的矩阵数据import numpy原创 2022-04-21 20:18:54 · 1292 阅读 · 0 评论 -
R语言绘制小提琴图geom_violin,如何添加额外的点geom_point?geom_violin + geom_boxplot + geom_point组合使用
下面展示的是Yeo 7网络的梯度分布,并添加额外的点(红色三角形)的小提琴图,先看一下效果图第一步:先加载R语言包rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)library(ggridges)第二步:加载数据#加载数据network_mean_gradient <- read.csv('E:\\R_Code\\plot_heat_map\\data\\networ原创 2022-04-21 19:53:12 · 1760 阅读 · 5 评论 -
R语言绘制山脊图 ggridge,如何给每个山脊添加自定义垂直线?
我们在用library(ggridges)画山脊图时,经常会遇到一个问题,怎么修改填充颜色,怎么添加一条垂直竖线,下面给出详细解答。上图的代码如下:rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)library(ggridges)#自定义每个类别的填充颜色colors <- c("#FF6600", "#31A354", "#0000FF") ggplot原创 2022-03-30 21:01:44 · 1187 阅读 · 0 评论 -
回归分析中,简述几种残差的定义?性质?作用以及特点?
回归分析中常用的残差有普通残差,学生化残差,删除残差,删除学生化残差。下面给出这几种残差的定义,性质,作用和特点。回归分析的几种残差定义和性质回归分析中回归诊断的主要内容普通残差学生化残差删除残差删除学生化残差回归分析中回归诊断的主要内容普通残差普通残差 residuals:实际观察值与估计值(拟合值)之间的差。超过正负 3 个 标准差范围的残差为异常值。性质: ei=yi−y^i=(I−H)Y,ei∼N(0,1)e_{i}=y_{i}-\hat{y}_{i}=(I-H) Y, \mathrm{原创 2022-03-27 10:54:19 · 7365 阅读 · 0 评论 -
什么是bootstrap和randomization?如何进行bootstrap和randomization统计推断?
bootstrap和randomization介绍背景bootstrap方法介绍程序设计思想例子randomization 方法——随机打乱样本数学模型 (Fisher' Z)总结使用bootstrap和randomization的⽅方法对(⽪皮尔逊)相关系数进⾏行行统计推断,并与使⽤用数学模型的⽅方法进⾏行行⽐比较。背景假设收集了了⼀一批数据,样本是15个被试(N=20N=20N=20),包含两个正态分布的变量量XXX和YYY,然后计算了这两个变量量之间的(⽪皮尔逊)相关系数R(X,Y)=0.38R原创 2022-03-08 20:18:22 · 435 阅读 · 2 评论 -
什么是FDR校正,核磁共振成像中FDR校正方法有哪些?如何进行FDR校正?
多重比较是统计学中的术语。当我们进行多次统计检验后,假阳性的次数就会增多,所以要对假阳性进行校正。原创 2022-03-04 21:13:58 · 6881 阅读 · 2 评论 -
脑科学统计方法总结
1 假设检验假设检验是指母体上做出某项假设,从母体随机的抽取一个子样,用它检验此项假设是否成立。在母体上的假设可分为两类:(1)对母体分布的参数做出某项假设,一般是对母体的数字特征作一项假设,用母体中子样检验此项假设是否成立,称这一类为参数假设检验。(2)对母体分布作某项假设,用母体中子样检验此项假设是否成立,称这一类为分布假设检验。下面重点总结在脑科学中常用的参数检验方法——t检验。t检验(t-test)又称学生t检验(Student t-test)可以说是统计推断中非常常见的一种检验方法,用于统原创 2022-02-14 21:34:31 · 1034 阅读 · 0 评论 -
corrplot和ggcorrplot画热力图
corrplot的基础用法和指南corrplot包主要针对相关系数输出的结果进行可视化,可以实现选择颜色,文本标签,颜色标签,布局等的操作。语法和常用参数介绍函数语法corrplot(corr, method = c("circle", "square", "ellipse", "number", "shade", "color", "pie"), type = c("full", "lower", "upper"), add = FALSE, col = NULL, bg = "white"转载 2021-09-21 10:19:24 · 1026 阅读 · 0 评论 -
偏最小二乘回归分析原理详解和案例分析实例
偏最小二乘回归分析原理详解背景偏最小二乘回归分析 Partial least squares regression analysis基本思想建模步骤步骤一:分别提取两变量组的第一对成分,并使之相关性达最大步骤二:建立 y1,⋯ ,yp\boldsymbol{y}_{1}, \cdots, \boldsymbol{y}_{p}y1,⋯,yp 对 u1\boldsymbol{u}_{1}u1 的回归及 x1,⋯ ,xm\boldsymbol{x}_{1}, \cdots, \boldsymbol{x}_{原创 2021-07-25 11:18:35 · 9428 阅读 · 6 评论 -
Matlab偏最小二乘回归命令plsregress详解
Matlab偏最小二乘回归命令plsregressMatlab工具箱中偏最小二乘回归命令plsregress的使用格式为[XL,YL,XS,YS,BETA,PCTVAR,MSE,stats] = plsregress (X,Y,ncomp)其中输入值为:X,Y,ncompX\mathrm{X}X 为 n×m\mathrm{n} \times \mathrm{m}n×m 的自变量数据矩阵, 每一行对应一个观测,每一列对应一个变量;Y\mathrm{Y}Y 为 n×p\mathrm{n} \tim原创 2021-07-25 11:17:03 · 4498 阅读 · 12 评论 -
图信号非参数假设检验:一种生成代替图信号的谱方法——A Spectral Method for Generating Surrogate Graph Signals
本文利用图的傅里叶变换定义了一种生成代理图信号的新方法。该方法是基于图傅里叶系数的符号随机化,因此,代理图信号的相关结构(即图拓扑上的平滑性)是由测量数据强加的。所提出的替代数据生成方法可广泛应用于非参数统计假设检验。在将测量的图信号转换到谱图域后,我们通过随机化来置换或随机生成图傅里叶(GFT) 系数 c 的符号。 接下来,逆 GFT 提供了替代图信号的实现。 相位随机化的等效图保留了 GFT 系数的幅度,并有效地强加了通过图拉普拉斯算子定义的代理自相关。 具体来说,在零假设下,测量的图形信号被假定为具原创 2021-07-17 16:59:04 · 208 阅读 · 0 评论 -
互信息介绍及MATLAB代码实现
互信息(Mutual information): 一种量化两个随机变量的非线性依赖性的信息理论度量方法First, we evaluate the similarity between each connectome harmonic and each of the 7 resting state networks using mutual information, an information theoretical measure quantifying the non-linear dependen原创 2021-07-17 16:43:58 · 2535 阅读 · 6 评论 -
一文读懂张量分解(展开)和Matlab实现
张量展开(tensor unfolding)是张量计算的重要组成部分,有时候,为了简化计算,将高阶张量展开成矩阵是非常有必要的。然而,由于高阶张量的这种“矩阵化”(matricization)过程比较抽象,因此,张量展开往往被视为张量计算的一大理解障碍。1. 什么是张量?为方便理解后面的张量展开,我们先看看什么是张量(X∈Rn1×n2×⋯×nd\mathcal{X} \in \mathbb{R}^{n_{1} \times n_{2} \times \cdots \times n_{d}}X∈Rn1×翻译 2021-06-27 15:58:28 · 3372 阅读 · 0 评论 -
什么是结构因果模型
结构因果模型结构因果模型简介定义历史因果关系之梯关联干预反事实因果因果和相关类型必要因充分因促成因模型因果图模型元素连接方式链叉对撞节点类型中介变量混杂因子工具变量孟德尔随机化关联独立性条件混杂/去混杂后门调整前门调整 Frontdoor Adjustment干预查询Do演算do演算规则集版本1版本2版本3扩展反事实潜在结果 Potential Outcome因果推断计算反事实 Conducting a counterfactual归因 Abduct行动 Act预测 Predict中介Mediation直接转载 2021-06-26 21:47:17 · 8742 阅读 · 0 评论 -
详解幂律分布,以及用于重尾分布的Python库powerlaw的使用
详解幂律分布,以及用于重尾分布的Python包powerlaw总述幂律分布简要回顾powerlaw库拟合效果powerlaw库基本操作介绍可视化拟合范围离散与连续数据与其他分布比较总述具有长尾特征的分布往往一目了然,但实际拟合过程却可能遇到各种各样的问题。本文将为读者介绍2014年由新加坡科技设计大学和麻省理工研究者联合发布的python库:powerlaw,专门适用于幂律等长尾特征分布的拟合,解决拟合烦恼。期刊来源:PLOS ONE论文标题:powerlaw: A Python Package翻译 2021-06-22 09:42:44 · 3818 阅读 · 2 评论 -
三大相关系数:Pearson、Spearman秩相关系数、kendall等级相关系数的联系与区别
三大统计相关系数:Pearson、Spearman秩相关系数、kendall等级相关系数统计相关系数简介Pearson(皮尔逊)相关系数1、简介2、适用范围3、使用方法Spearman Rank(斯皮尔曼等级)相关系数1、简介2、适用范围3、使用方法Kendall Rank(肯德尔等级)相关系数1、简介2、适用范围3、使用方法联系与区别统计相关系数简介相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:(1)、当相关系数为原创 2021-05-25 14:22:00 · 5077 阅读 · 3 评论 -
最全总结Python 第三方库安装方法
下面将自己学习过程中总结的Python第三方库的安装常用三种方法分享给大家,本人推荐前面两种方式。(已安装Python)方法一:pip命令行直接安装打开cmd命令窗口,通过命令 pip install 包名 进行第三库安装,此方法简单快捷,示例安装keras库。 注意:安装成功会显示Successfully installed keras,如果出现黄色字体警告,是由于pip库包不是最新的,但keras库已成功安装,可随后对pip包进行更新,更新命令: python -m pip install转载 2021-05-13 15:13:40 · 9727 阅读 · 0 评论 -
matlab画图总结——二维图plot函数、图形标注和坐标轴控制、饼图、条形图、排列图;三维图的绘制
Matlab画图总结1. 二维数据曲线图1.1 绘制二维曲线的基本函数1.plot()函数2. 含多个输入参数的plot函数3. 含选项的plot函数4. 双纵坐标函数plotyy1.2 绘制图形的辅助操作1.图形标注2. 坐标控制1.3 绘制二维图形的其他函数1.对数坐标图2. 饼图3. 条形图4. 排列图2. 三维图形2.1 绘制三维曲线1.用plot3()函数画三维曲线2. 三维网格图的绘制2.2 三维表面图的绘制2.3 三维切片图的绘制1. 二维数据曲线图1.1 绘制二维曲线的基本函数1.pl转载 2021-05-11 21:22:16 · 18000 阅读 · 0 评论 -
生物医学统计方法总结
来源:https://mp.weixin.qq.com/s/WH4aZ75Q_UVy5w8fCbG2ig原创 2021-05-10 15:59:41 · 821 阅读 · 0 评论 -
生物医学中常用的假设检验总结——正态性检验、t检验、方差分析、秩和检验、卡方检验
医学中常用的假设检验总结1 医学中常用的假设检验总结1.1 正态性检验1.2 方差齐性检验1.3 t 检验1.4 方差分析1.5 卡方检验1.6 秩和检验1 医学中常用的假设检验总结1.1 正态性检验Shapiro-Wilk正态检验方法来检验样本是否符合正态分布:shapiro.test(x) # 正态性检验,p-value 大于0.05时为正态分布1.2 方差齐性检验① Bartlett检验,适用于正态分布数据;数据非正态时则容易导致假阳性bartlett.test(V~Group原创 2021-04-11 17:51:15 · 5854 阅读 · 1 评论 -
R语言绘制散点图和边际图(柱形图,小提琴图)
ggplot2 + ggExtra绘制边际散点图原创 2021-04-11 16:49:53 · 2223 阅读 · 2 评论 -
R语言做统计检验绘图如何添加p-value和显著性标记?——详细介绍如何通过ggpubr包为ggplot图添加p-value以及显著性标记?
R语言做统计检验绘图如何添加p-value和显著性标记?——详细介绍如何通过ggpubr包为ggplot图添加p-value以及显著性标记?原创 2021-04-05 21:57:42 · 4915 阅读 · 3 评论 -
方差分析时,如何搞定方差分析、盒型图、显著性标记?——以Graphpad Prism 8.0为例
方差分析时,如何搞定方差分析、盒型图、显著性标记?——以Graphpad Prism 8.0为例原创 2021-04-05 21:22:02 · 6113 阅读 · 0 评论 -
R语言详解参数检验和非参数检验——样本T检验、方差分析、pearson相关性检验、单样本wilcoxon检验、Mann-Whitney检验、配对样本wilcoxon检验、列联表检验、卡方检验
R语言详解参数检验和非参数检验二、参数检验R语言实现2.1 单样本t检验2.2 独立样本t检验2.3 配对样本t检验2.4方差分析2.5 pearson相关性检验三、非参数检验R语言实现3.1单样本wilcoxon检验3.2 Mann-Whitney检验3.3配对样本wilcoxon检验3.4 Kruskal-wallis和置换多元方差分析检验3.5 spearman相关性检验四、列联表检验(定性资料)4.1 pearson卡方检验4.2 Fisher精确检验4.3 Cochran-Mantel–H原创 2021-04-05 20:19:11 · 5325 阅读 · 4 评论 -
时间序列分析中如何求偏相关系数和最佳线性预报系数。ARMA(2,1)过程,ε_t是高斯白噪声WN(0,1),求该序列的前3 个偏相关系数和最佳线性预报系数
时间序列分析中如何求偏相关系数和最佳线性预报系数。ARMA(2,1)过程,ε_t是高斯白噪声WN(0,1)。求该序列的前3 个偏相关系数和最佳线性预报系数原创 2021-04-02 17:55:49 · 1780 阅读 · 0 评论 -
请计算ARMA(2,2)的因果域,平稳域、可逆域,并画出相应区域的图形。
请计算ARMA(2,2)的因果域,平稳域、可逆域,并画出相应区域的图形。原创 2021-04-02 17:49:27 · 1720 阅读 · 0 评论 -
怎么安装Latex——Texstudio+Texlive 2020+Sumatra PDF详细安装教材
怎么安装Latex——Texstudio+Texlive 2020+Sumatra PDF详细安装教材原创 2021-03-20 18:57:10 · 1203 阅读 · 0 评论 -
实际问题中提出一个检验统计量,如何确定其分布?
原创 2021-03-13 22:58:26 · 565 阅读 · 2 评论 -
模拟产生2组(每组1000个)独立的[0,1]上均匀分布的随机数,求和并画出数据的直方图,观察结果是否仍是均匀分布?产生12组求和的结果?
本题验证均匀分布是否具有可加性和模拟中心极限定理。利用函数runif()产生随机数,其中min=0, max=1表示均匀分布的区间。其模拟1000个均匀分布随机数如图9所示,2组均匀分布随机数相加如图10所示。从图10可看出,2个均匀分布相加不为均匀分布,其为三角分布。下面给出相应的代码:n <-1000a <- runif(n, min=0, max=1)b <- runif(n, min=0, max=1)par(mfrow=c(2,1)) hist(a,prob=T,mai原创 2021-03-13 22:54:14 · 1235 阅读 · 0 评论 -
模拟100个 正态分布的随机数,计算其样本均值和样本方差,观察其余真实值的差异。当增大样本容量时,其差异有何规律。
用R软件随机模拟产生6组均值为5,方差为100的随机数,其样本个数分别设为100,1000,10000,100000,1000000,10000000,100000000。观察各组数据的样本方差和样本均值的差异。下面给出模拟程序:n <- c(100,1000,10000,100000,1000000,10000000,100000000)for(i in 1:length(n)){ mean01[i] <- mean(rnorm(n[i], mean=5, sd=10)) var0原创 2021-03-13 22:50:40 · 4017 阅读 · 0 评论 -
如果你构造了一个统计量其分布不容易确定,如何通过实验的方法给出其相应分布的分位数?
如果你构造了一个统计量其分布不容易确定,如何通过实验的方法给出其相应分布的分位数?原创 2021-03-13 22:46:42 · 197 阅读 · 0 评论 -
收集整理1-2个自己熟知的假设检验问题,并给出检验统计量的分布。
收集整理1-2个自己熟知的假设检验问题,并给出检验统计量的分布。原创 2021-03-13 22:43:05 · 393 阅读 · 0 评论 -
构造原理中的独立性条件如果不满足,是否原结论仍然成立?试用模拟的方法验证你的结论。
构造原理中的独立性条件如果不满足,是否原结论仍然成立?试用模拟的方法验证你的结论。原创 2021-03-13 22:33:57 · 302 阅读 · 0 评论 -
Stata做统计分析详细教材
一、STATA输出安装estout。最简单的方式是在stata的指令输入:ssc install estout, replace。EST安装的指导网址是:EST安装的指导网址跑你的regression写下这行指令esttab using test.rtf,然后就会出现个漂亮的表格给你(WORD文档)。只要再小幅修改,就可以直接用了。这个档案会存在my document\stata下。如果你用打开的是一个stata do file,结果会保存到do文件所在文件夹中。如果要得到excel文件,就把后缀改原创 2021-01-14 20:13:49 · 5091 阅读 · 1 评论 -
详解线性代数的二次型
1.n\mathbf{n}n个变量x1,x2,⋯ ,xn\mathbf{x}_{\mathbf{1}}\mathbf{,}\mathbf{x}_{\mathbf{2}}\mathbf{,\cdots,}\mathbf{x}_{\mathbf{n}}x1,x2,⋯,xn的二次齐次函数f(x1,x2,⋯ ,xn)=∑i=1n∑j=1naijxiyjf(x_{1},x_{2},\cdots,x_{n}) = \sum_{i = 1}^{n}{\sum_{j =1}^{n}{a_{{ij}}x_{i}y_{原创 2021-01-02 14:43:11 · 1093 阅读 · 0 评论 -
详解矩阵的特征值和特征向量
1.矩阵的特征值和特征向量的概念及性质(1) 设λ\lambdaλ是AAA的一个特征值,则 kA,aA+bE,A2,Am,f(A),AT,A−1,A∗{kA},{aA} + {bE},A^{2},A^{m},f(A),A^{T},A^{- 1},A^{*}kA,aA+bE,A2,Am,f(A),AT,A−1,A∗有一个特征值分别为kλ,aλ+b,λ2,λm,f(λ),λ,λ−1,∣A∣λ,{kλ},{aλ} + b,\lambda^{2},\lambda^{m},f(\lambda),\lambda,\l原创 2021-01-02 14:41:42 · 2355 阅读 · 0 评论 -
线性方程组的几种解法以及解的性质和结构
1.克莱姆法则线性方程组{a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯⋯⋯⋯⋯⋯⋯⋯⋯an1x1+an2x2+⋯+annxn=bn\begin{cases} a_{11}x_{1} + a_{12}x_{2} + \cdots +a_{1n}x_{n} = b_{1} \\ a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} =b_{2} \\ \quad\cdots\cdots\cdots\cdots\原创 2021-01-02 14:35:25 · 5561 阅读 · 2 评论