sta@ma@brain
从事核磁共振脑科学研究,在Nature communications等权威期刊发表磁共振相关研究成果。熟练掌握磁共振成像数据处理方法(T1w, fMRI, dWI)和统计检验方法。本博客以记录学习中的点滴,着重记录从影像数据处理软件安装,数据处理步骤,以及分析方法(图论,矩阵理论,统计检验方法,回归分析,机器学习等),希望对志同道合的有一定的帮助。
展开
-
如何直观地理解傅立叶变换?频域和时域的理解
比如在图像处理里,将图像函数看做一个信号函数,对图像某一区块其进行上述标准化互相关函数中讲到的亮度和对比度不变性处理后,进行傅里叶变换,并最后算出图像功率谱,于是就有了一个很好的以频率表达的可用于模板匹配的模板属性。每个正弦分量都有自己的频率和幅值,这样,以频率值作横轴,以幅值作纵轴,把上述若干个正弦信号的幅值画在其所对应的频率上,就做出了信号的幅频分布图,也就是所谓频谱图。频谱图里的竖线分别代表了不同频率的正弦波函数,也就是之前的基,而高度则代表在这个频率上的振幅,也就是这个基上的坐标分量。原创 2023-02-11 16:07:20 · 994 阅读 · 0 评论 -
R语言如何绘制雷达图,radarchart包的使用
先看一下效果图论文里面一般展示雷达图如下下面我们使用fmsb包中的radarchart函数需要一个数据,其中第一行代表数据的最大值(10),第二行代表数据的最小值(0)。否则,需要设置maxmin = FALSE。注意,列数必须大于2。每一列是一个变量,行表示组。在df中我们只有一组和8个不同的变量。Data set with one groupset.seed(1)df <- data.frame(rbind(rep(10, 8), rep(0, 8),原创 2022-05-05 21:59:53 · 1327 阅读 · 2 评论 -
如何用python画下三角矩阵的相关热力图?sns.heatmap详解
python如何绘制下三角矩阵的热力图,先看一下效果图加载必要的包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport scipy.stats as stats from matplotlib.ticker import FormatStrFormatterencoding="utf-8"加载数据#读取数据data = pd.read_excel原创 2022-04-30 07:00:00 · 2480 阅读 · 0 评论 -
做相关性分析时,如何排除奇异值Outliers,以增加相关分析的准确性
如下图所示,如何排序奇异值,以提高性两者之间的相关性。思想: 为了提高相关性分析,我们通过从双变量平均值中为每个观察值求马氏距离来识别异常值,并排除平均 马氏距离 为 6 或更大的所有点。代码下载地址:做相关性分析时,如何排除奇异值Outliers,以增加相关分析的准确性Rousselet 和 Pernet (2012) 证明异常值可以扭曲 Pearson 相关性。他们声称,通过选择和重新分析一组已发表的研究,这会导致广泛的统计错误。然而,他们既没有报告这项调查的研究身份,也没有报告纳入标准,因此他原创 2022-04-21 21:17:26 · 1037 阅读 · 0 评论 -
如何使用Colormaps和自定义自己喜欢的colorbar?
在做图时,总是觉得自己的配色很差,这怎么办呢?下面,我将介绍如何使用Python自带的Colormaps,和自定义自己想要的colorbar.Python自带的colorbarPython有非常丰富的颜色图,比如下面的网站, 请访问Choosing Colormaps in Matplotlib 上面有比较多的colorbar。比如如何获取python的颜色比如我们需要图里面的RdBu颜色图应该如何操作呢?我们首先需要在python中得到我们需要的颜色图的矩阵数据import numpy原创 2022-04-21 20:18:54 · 1292 阅读 · 0 评论 -
R语言绘制小提琴图geom_violin,如何添加额外的点geom_point?geom_violin + geom_boxplot + geom_point组合使用
下面展示的是Yeo 7网络的梯度分布,并添加额外的点(红色三角形)的小提琴图,先看一下效果图第一步:先加载R语言包rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)library(ggridges)第二步:加载数据#加载数据network_mean_gradient <- read.csv('E:\\R_Code\\plot_heat_map\\data\\networ原创 2022-04-21 19:53:12 · 1760 阅读 · 5 评论 -
R语言绘制小提琴图geom_violin,如何给每个小提琴添加自定义直线?
R语言绘制小提琴图geom_violin,如何给每个小提琴添加自定义直线?效果如下图所示:数据按照下面的方式进行存储下面提供所需要的代码:#加载必要的包rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)#首先读取数据##加载数据melted_df<- read.csv('E:\\R_Code\\plot_heat_map\\melted_df.csv', head原创 2022-04-02 22:47:29 · 1313 阅读 · 0 评论 -
R语言绘制山脊图 ggridge,如何给每个山脊添加自定义垂直线?
我们在用library(ggridges)画山脊图时,经常会遇到一个问题,怎么修改填充颜色,怎么添加一条垂直竖线,下面给出详细解答。上图的代码如下:rm(list = ls())library(magrittr)library(tidyverse)library(dplyr)library(ggplot2)library(ggridges)#自定义每个类别的填充颜色colors <- c("#FF6600", "#31A354", "#0000FF") ggplot原创 2022-03-30 21:01:44 · 1187 阅读 · 0 评论 -
回归分析中,简述几种残差的定义?性质?作用以及特点?
回归分析中常用的残差有普通残差,学生化残差,删除残差,删除学生化残差。下面给出这几种残差的定义,性质,作用和特点。回归分析的几种残差定义和性质回归分析中回归诊断的主要内容普通残差学生化残差删除残差删除学生化残差回归分析中回归诊断的主要内容普通残差普通残差 residuals:实际观察值与估计值(拟合值)之间的差。超过正负 3 个 标准差范围的残差为异常值。性质: ei=yi−y^i=(I−H)Y,ei∼N(0,1)e_{i}=y_{i}-\hat{y}_{i}=(I-H) Y, \mathrm{原创 2022-03-27 10:54:19 · 7365 阅读 · 0 评论 -
python读取数据方法
python读取数据方法1.1读取 csv文件。用到pandas库中的read_csv()函数,格式如下:读取格式:import pandas as pdcsv_data= pd.read_csv(’/路径/文件名.csv’)1.2读取txt文件。格式如下:读取格式:f= open(’/路径/文件名.txt’, ‘r’)1.3读取excel文件。用到xlrd库(pip install xlrd安装,导入模块import xlrd)。读取格式:import xlrddata=xlrd.op转载 2021-09-22 10:21:00 · 6776 阅读 · 0 评论 -
偏最小二乘回归分析原理详解和案例分析实例
偏最小二乘回归分析原理详解背景偏最小二乘回归分析 Partial least squares regression analysis基本思想建模步骤步骤一:分别提取两变量组的第一对成分,并使之相关性达最大步骤二:建立 y1,⋯ ,yp\boldsymbol{y}_{1}, \cdots, \boldsymbol{y}_{p}y1,⋯,yp 对 u1\boldsymbol{u}_{1}u1 的回归及 x1,⋯ ,xm\boldsymbol{x}_{1}, \cdots, \boldsymbol{x}_{原创 2021-07-25 11:18:35 · 9428 阅读 · 6 评论 -
Matlab偏最小二乘回归命令plsregress详解
Matlab偏最小二乘回归命令plsregressMatlab工具箱中偏最小二乘回归命令plsregress的使用格式为[XL,YL,XS,YS,BETA,PCTVAR,MSE,stats] = plsregress (X,Y,ncomp)其中输入值为:X,Y,ncompX\mathrm{X}X 为 n×m\mathrm{n} \times \mathrm{m}n×m 的自变量数据矩阵, 每一行对应一个观测,每一列对应一个变量;Y\mathrm{Y}Y 为 n×p\mathrm{n} \tim原创 2021-07-25 11:17:03 · 4498 阅读 · 12 评论 -
一文秒懂图卷积神经网络Graph Convolutional Network(GCN)——从图信号处理(GSP)到图卷积神经网络详细推导
参考资料:对卷积的理解和物理意义图卷积网络 GCN Graph Convolutional Network(谱域GCN)的理解和详细推导【GNN】万字长文带你入门 GCN【Code】关于 GCN,我有三种写法githup地址,代码,论文总结和推荐如何理解 Graph Convolutional Network(GCN)?——清华大学博士解读...原创 2021-07-09 20:09:42 · 958 阅读 · 3 评论 -
一文读懂张量分解(展开)和Matlab实现
张量展开(tensor unfolding)是张量计算的重要组成部分,有时候,为了简化计算,将高阶张量展开成矩阵是非常有必要的。然而,由于高阶张量的这种“矩阵化”(matricization)过程比较抽象,因此,张量展开往往被视为张量计算的一大理解障碍。1. 什么是张量?为方便理解后面的张量展开,我们先看看什么是张量(X∈Rn1×n2×⋯×nd\mathcal{X} \in \mathbb{R}^{n_{1} \times n_{2} \times \cdots \times n_{d}}X∈Rn1×翻译 2021-06-27 15:58:28 · 3372 阅读 · 0 评论 -
什么是结构因果模型
结构因果模型结构因果模型简介定义历史因果关系之梯关联干预反事实因果因果和相关类型必要因充分因促成因模型因果图模型元素连接方式链叉对撞节点类型中介变量混杂因子工具变量孟德尔随机化关联独立性条件混杂/去混杂后门调整前门调整 Frontdoor Adjustment干预查询Do演算do演算规则集版本1版本2版本3扩展反事实潜在结果 Potential Outcome因果推断计算反事实 Conducting a counterfactual归因 Abduct行动 Act预测 Predict中介Mediation直接转载 2021-06-26 21:47:17 · 8742 阅读 · 0 评论 -
详解幂律分布,以及用于重尾分布的Python库powerlaw的使用
详解幂律分布,以及用于重尾分布的Python包powerlaw总述幂律分布简要回顾powerlaw库拟合效果powerlaw库基本操作介绍可视化拟合范围离散与连续数据与其他分布比较总述具有长尾特征的分布往往一目了然,但实际拟合过程却可能遇到各种各样的问题。本文将为读者介绍2014年由新加坡科技设计大学和麻省理工研究者联合发布的python库:powerlaw,专门适用于幂律等长尾特征分布的拟合,解决拟合烦恼。期刊来源:PLOS ONE论文标题:powerlaw: A Python Package翻译 2021-06-22 09:42:44 · 3818 阅读 · 2 评论 -
R语言做统计检验绘图如何添加p-value和显著性标记?——详细介绍如何通过ggpubr包为ggplot图添加p-value以及显著性标记?
R语言做统计检验绘图如何添加p-value和显著性标记?——详细介绍如何通过ggpubr包为ggplot图添加p-value以及显著性标记?原创 2021-04-05 21:57:42 · 4915 阅读 · 3 评论 -
R语言详解参数检验和非参数检验——样本T检验、方差分析、pearson相关性检验、单样本wilcoxon检验、Mann-Whitney检验、配对样本wilcoxon检验、列联表检验、卡方检验
R语言详解参数检验和非参数检验二、参数检验R语言实现2.1 单样本t检验2.2 独立样本t检验2.3 配对样本t检验2.4方差分析2.5 pearson相关性检验三、非参数检验R语言实现3.1单样本wilcoxon检验3.2 Mann-Whitney检验3.3配对样本wilcoxon检验3.4 Kruskal-wallis和置换多元方差分析检验3.5 spearman相关性检验四、列联表检验(定性资料)4.1 pearson卡方检验4.2 Fisher精确检验4.3 Cochran-Mantel–H原创 2021-04-05 20:19:11 · 5325 阅读 · 4 评论 -
样本T检验、方差分析(ANOVA)、wilcoxon秩和检验、KW秩和检验详解和操作步骤
阅读期刊文献时,各种统计检验(T检验、wilcoxon秩和检验、方差分析…)方法让人眼花缭乱,分不清它们之间的区别;当处理自己数据时,又面临着不知道如何挑选合适的检验方法,学习操作那些复杂的生信软件等等挑战。各类统计检验究竟有何差别,该如何选择?有没有快速便捷的工具可以实现数据的统计检验?我们为大家解答这两个问题。对于一项研究成果数据上的评判,我们需要用一个明确、客观的指标加以说明,这就是统...原创 2021-04-05 19:14:13 · 19752 阅读 · 2 评论 -
详解结构方程模型、路径分析方法
一、简介微生物群落研究逐渐从单一的群落结构研究转向分析群落与环境因素的关联互作机制研究当中,典型的环境因子分析方法有CCA/RDA、互作网络图、VPA分析等,这些分析能帮助我们逐一比较待选的环境因子与微生物群落数据间的关联性,细致挖掘对群落结构有影响的个别环境因子。需要注意到的是,环境对微生物群落的影响是间接的,例如:气温因素影响了植物的生长状态,植物的生长状态的变化影响土壤微生物的群落结构......原创 2021-04-05 18:58:07 · 16833 阅读 · 0 评论 -
怎么安装Latex——Texstudio+Texlive 2020+Sumatra PDF详细安装教材
怎么安装Latex——Texstudio+Texlive 2020+Sumatra PDF详细安装教材原创 2021-03-20 18:57:10 · 1203 阅读 · 0 评论 -
缺血性脑卒中对大脑功能连接梯度的影响
原文:The impact of ischemic stroke on connectivity gradients发表在2019年NeuroImage: Clinical摘要大脑功能的组织形式可以用一个低维空间来表示,它反映了大脑宏观尺度上的层次结构。这个空间的不同维度被称为功能连接梯度,它反映了不同脑区沿着某个连续空间的功能连接之间的相似性。我们在已知一些大脑的病理改变会影响到脑区的功能连接的情况下,再研究这些病变如何影响到功能连接梯度,就可以为功能连接梯度提供生理相关性支持。之前的研究表明,局部原创 2021-03-16 09:43:37 · 1139 阅读 · 0 评论 -
脑电信号(EEG)处理中的机器学习方法总结——回归模型,SVM、K近邻、人工神经网络、朴素贝叶斯、决策树和随机森林、集成学习、模糊逻辑、LDA线性判别分析、K-means聚类、强化学习、迁移学习
本文归纳总结了机器学习在脑电分析中的应用,并详细介绍回归模型,SVM、K近邻、人工神经网络、朴素贝叶斯、决策树和随机森林、集成学习、模糊逻辑、LDA线性判别分析、K-means聚类、强化学习、迁移学习等机器学习方法的有效性、关键特性及其最适合的应用场景。文章来源于2020年发表的《A Review on Machine Learning for EEG Signal Processing in Bioengineering》EEG机器学习方法总结A.概览B.回归模型C. SVM支持向量机D. KNN K原创 2021-01-06 19:37:32 · 4056 阅读 · 0 评论 -
详解线性代数的二次型
1.n\mathbf{n}n个变量x1,x2,⋯ ,xn\mathbf{x}_{\mathbf{1}}\mathbf{,}\mathbf{x}_{\mathbf{2}}\mathbf{,\cdots,}\mathbf{x}_{\mathbf{n}}x1,x2,⋯,xn的二次齐次函数f(x1,x2,⋯ ,xn)=∑i=1n∑j=1naijxiyjf(x_{1},x_{2},\cdots,x_{n}) = \sum_{i = 1}^{n}{\sum_{j =1}^{n}{a_{{ij}}x_{i}y_{原创 2021-01-02 14:43:11 · 1093 阅读 · 0 评论 -
详解矩阵的特征值和特征向量
1.矩阵的特征值和特征向量的概念及性质(1) 设λ\lambdaλ是AAA的一个特征值,则 kA,aA+bE,A2,Am,f(A),AT,A−1,A∗{kA},{aA} + {bE},A^{2},A^{m},f(A),A^{T},A^{- 1},A^{*}kA,aA+bE,A2,Am,f(A),AT,A−1,A∗有一个特征值分别为kλ,aλ+b,λ2,λm,f(λ),λ,λ−1,∣A∣λ,{kλ},{aλ} + b,\lambda^{2},\lambda^{m},f(\lambda),\lambda,\l原创 2021-01-02 14:41:42 · 2355 阅读 · 0 评论 -
线性方程组的几种解法以及解的性质和结构
1.克莱姆法则线性方程组{a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2⋯⋯⋯⋯⋯⋯⋯⋯⋯an1x1+an2x2+⋯+annxn=bn\begin{cases} a_{11}x_{1} + a_{12}x_{2} + \cdots +a_{1n}x_{n} = b_{1} \\ a_{21}x_{1} + a_{22}x_{2} + \cdots + a_{2n}x_{n} =b_{2} \\ \quad\cdots\cdots\cdots\cdots\原创 2021-01-02 14:35:25 · 5561 阅读 · 2 评论 -
详解线性代数中的向量线性表示、线性相关性、基变换及过渡矩阵、Schmidt正交化
向量的基础知识及相关性质1.有关向量组的线性表示2.有关向量组的线性相关性3.有关向量组的线性表示4.向量组的秩与矩阵的秩之间的关系5.n\mathbf{n}n维向量空间的基变换公式及过渡矩阵6.坐标变换公式7.向量的内积8.Schmidt正交化9.正交基及规范正交基1.有关向量组的线性表示(1)α1,α2,⋯ ,αs\alpha_{1},\alpha_{2},\cdots,\alpha_{s}α1,α2,⋯,αs线性相关⇔\Leftrightarrow⇔至少有一个向量可以用其余向量线性表示。(原创 2021-01-02 14:31:24 · 1247 阅读 · 3 评论 -
详解线性代数中矩阵的线性运算——加法、乘法、数乘、矩阵的逆、矩阵的逆、分块矩阵
矩阵:m×nm \times nm×n个数aija_{{ij}}aij排成mmm行nnn列的表格[a11a12⋯a1na21a22⋯a2n⋯⋯⋯⋯⋯am1am2⋯amn]\begin{bmatrix} a_{11}\quad a_{12}\quad\cdots\quad a_{1n} \\ a_{21}\quad a_{22}\quad\cdots\quad a_{2n} \\ \quad\cdots\cdots\cdots\cdots\cdots \\ a_{m1}\quad a_{m2}\quad原创 2021-01-02 14:24:06 · 2000 阅读 · 0 评论 -
行列式按行(列)展开定理——6种行列式的展开方式
下面介绍6种行列式的展开方式:(1) 设A=(aij)n×nA = ( a_{{ij}} )_{n \times n}A=(aij)n×n,则ai1Aj1+ai2Aj2+⋯+ainAjn={∣A∣,i=j0,i≠ja_{i1}A_{j1} +a_{i2}A_{j2} + \cdots + a_{{in}}A_{{jn}} = \begin{cases}|A|,i=j\\ 0,i \neq j\end{cases}ai1Aj1+ai2Aj2+⋯+ainAjn={∣A∣,i=j0,i=j原创 2021-01-02 14:16:14 · 13826 阅读 · 1 评论 -
高等数学知识点总结——导数定义及性质、微积分、泰勒展开、洛必达法则、函数单调性判断
高等数学知识点总结1.导数定义2.左右导数导数的几何意义和物理意义3.函数的可导性与连续性之间的关系4.平面曲线的切线和法线5.四则运算法则6.基本导数与微分表7.复合函数,反函数,隐函数以及参数方程所确定的函数的微分法8.常用高阶导数公式9.微分中值定理,泰勒公式10.洛必达法则11.泰勒公式12.函数单调性的判断13.渐近线的求法14.函数凹凸性的判断15.弧微分16.曲率17.曲率半径1.导数定义导数和微分的概念f′(x0)=limΔx→0 f(x0+Δx)−f(x0)Δxf'({{x}_{原创 2021-01-02 14:09:20 · 1319 阅读 · 0 评论 -
线性代数知识点总结——矩阵乘法、矩阵运算与性质、矩阵微积分
线性代数知识点总结1. 基础概念和符号1.1 基本符号2.矩阵乘法2.1 向量-向量乘法2.2 矩阵-向量乘法2.3 矩阵-矩阵乘法3 运算和属性3.1 单位矩阵和对角矩阵3.2 转置3.3 对称矩阵3.4 矩阵的迹3.5 范数3.6 线性相关性和秩3.7 方阵的逆3.8 正交阵3.9 矩阵的值域和零空间3.10 行列式3.11 二次型和半正定矩阵3.12 特征值和特征向量3.13 对称矩阵的特征值和特征向量4.矩阵微积分4.1 梯度4.2 黑塞矩阵4.3 二次函数和线性函数的梯度和黑塞矩阵4.4 最小二原创 2021-01-02 13:48:12 · 1425 阅读 · 0 评论 -
详解高斯过程回归和核贝叶斯线性回归
详解高斯过程回归高斯过程回归核贝叶斯线性回归函数空间的观点高斯过程回归将一维高斯分布推广到多变量中就得到了高斯网络,将多变量推广到无限维,就得到了高斯过程,高斯过程是定义在连续域(时间空间)上的无限多个高维随机变量所组成的随机过程。在时间轴上的任意一个点都满足高斯分布吗,将这些点的集合叫做高斯过程的一个样本。对于时间轴上的序列 ξt\xi_tξt,如果 ∀n∈N+,ti∈T\forall n\in N^+,t_i\in T∀n∈N+,ti∈T,有 ξt1−tn∼N(μt1−tn,Σt1−tn)原创 2021-01-02 13:21:19 · 2050 阅读 · 0 评论 -
详解回归分析中相关变量选择的方法和构建思想——岭回归、LASSO 回归、主成分回归和偏最小二乘回归
在线性回归模型中,其参数估计公式为 $\beta=\left(X^{T} X\right)^{-1} X^{T} y,$ 当 $X^{T} X$ 不可逆时无法求出 $\beta,$ 另外,如果 $\left|X^{T} X\right|$ 越趋近于 $0,$ 会使得回归系数趋向于无穷大, 此时得到的回归系数是无意义的。解决这类问题可 以使用岭回归、LASSO 回归、主成分回归、偏最小二乘回归, 主要针对自变量之间存在多重共线性或者自变量个数多于样本量的情况。原创 2020-12-26 13:09:12 · 2210 阅读 · 0 评论 -
统计学中假设检验有关P值的讨论
摘要:统计检验能有效确定从样本统计推断至总体时所犯错误的概率,其在医学、临床试验。观察性研究方面有着重要意义。近年来期刊编辑和统计顾问越来越关注医学文献中显着性检验和P值的过度使用和误解。为了澄清对统计学检验和P值的误解和误用,本文通过回顾P值相关理论,总结了P值的优势和劣势,强调了P值在使用中应注意的问题,旨在使非统计专业人员避免对P值的误解和误用。关键词:P值;假设检验;置信区间原创 2020-12-25 09:21:32 · 1704 阅读 · 0 评论 -
概率论和数理统计知识点总结
随机事件和概率1.事件的关系与运算(1) 子事件:A⊂BA \subset BA⊂B,若AAA发生,则BBB发生。(2) 相等事件:A=BA = BA=B,即A⊂BA \subset BA⊂B,且B⊂AB \subset AB⊂A 。(3) 和事件:A⋃BA\bigcup BA⋃B(或A+BA + BA+B),AAA与BBB中至少有一个发生。(4) 差事件:A−BA - BA−B,AAA发生但BBB不发生。(5) 积事件:A⋂BA\bigcap BA⋂B(或AB{AB}AB),AAA与BBB同时原创 2020-12-21 16:08:37 · 3747 阅读 · 4 评论 -
详解支持向量机(SVM)算法与代码实现
支撑向量机(SVM)算法与代码实现约束优化问题硬间隔 SVM软间隔 SVM核方法介绍小结支撑向量机(SVM)算法在分类问题中有着重要地位,其主要思想是最大化两类之间的间隔。按照数据集的特点:线性可分问题,如之前的感知机算法处理的问题线性可分,只有一点点错误点,如感知机算法发展出来的 Pocket 算法处理的问题非线性问题,完全不可分,如在感知机问题发展出来的多层感知机和深度学习这三种情况对于 SVM 分别有下面三种处理手段:硬间隔 SVM软间隔 SVM核方法 MethodSVM 的原创 2020-12-21 15:08:40 · 1930 阅读 · 5 评论