
笔记
文章平均质量分 52
生信小博士
本人声明2024年之前的内容非本人原创,仅作为记录本人的学习过程的一个平台,当时声明原创是由于平台自动默认,刚使用这个平台不太清楚,现在很多文章找不到原文链接,批量修改过于复杂,如有内容不适合发表在本博客上,对您造成影响,请及时联系我删除该内容或在文章下方声明是您的原创,不甚感激。2024年的内容为本人原创如有兴趣,可关注了解。
展开
-
更改细胞名称 名字setidents
Get, set, and manipulate an object's identity classes — Idents • SeuratObject原创 2024-08-31 05:26:21 · 253 阅读 · 0 评论 -
处理conda安装工具的动态库问题——解决记录 libssl.1.0.0 系统中所有openssl位置全览 whereis openssl
处理conda安装工具的动态库问题——解决记录 - 简书解决`libssl.so.1.0.0: cannot open shared object file: No such file or directory`问题 - 简书原创 2023-09-28 15:44:26 · 2212 阅读 · 0 评论 -
参数检验和非参数检验简介 t检验p值 mann-white 方差分析 annova
在统计分析中分析中经常遇到某种检验方法为参数检验或非参数检验,例如T检验、Tukey检验、方差分析都属于参数检验,而Wilcoxon秩和检验,Anosim分析、MRPP分析、Adonis分析、Amova分析都属于非参数检验,那么什么叫参数检验和非参数检验?image.png。原创 2023-07-10 09:33:34 · 1181 阅读 · 0 评论 -
GC-MS靶向代谢组学定量方法及方法学验证
是一种间接或相对的校准方法,在分析测定样品中某组分含量时,加入一种内标物质,以校准和消除由于操作条件、仪器波动对分析结果产生的影响,可提高分析结果的准确度。用待测组分的标准品作对照物质,将对照物质和样品中待测组分的响应信号相比较进行定量的方法,也称为标准曲线法,是一种绝对定量的方法。:利用待分离的各种物质在两相中的分配系数、吸附能力等理化性质的不同来进行分离,然后进入质谱检测器进行检测的过程。除了代谢物的提取,代谢物的纯化与富集也是非常重要的;实际值与计量值之间的偏差,可以用加标回收率表示。原创 2023-07-10 07:40:22 · 852 阅读 · 0 评论 -
我要保留第一个-后面所有的内容 gsub
sub("^[^-]*-", "", colnames(up_data))原创 2023-07-06 12:16:42 · 82 阅读 · 0 评论 -
ibaq intensity 蛋白组学 蛋白质组学两个定量方法(iBAQ和LFQ)的区别及常见的标准化方法
LFQ:基于 Intensity 的强度值,在不同样本间执行矫正操作,达到降低样本预处理,仪器分析等操作造成的样本间的差异,主要用于同一蛋白,不同样本间的表达差异。当我们在进行搜库时,如果两个参数都选择,将会在结果文件中有三个定量结果:Intensity,IBAQ和LFQ。iBAQ:基于 Intensity 的强度值,除以该蛋白的理论肽段数目,主要用于同一样本内,不同蛋白的相互比较。首先,在使用Maxquant软件进行查库的时候,有两个参数值得大家关注:LFQ和iBAQ。原创 2023-07-06 02:04:00 · 3708 阅读 · 0 评论 -
转录组和蛋白组如何关联分析?先从绘制九象限图开始
九象限图在多组学关联分析中非常重要,例如我们可以用九象限图展示“转录组+蛋白组”、“转录组+翻译组”等关联分析中不同基因的差异表达情况。通过分析两种组学数据的相关性,我们可进一步缩小候选基因的范围。中介绍过九象限图的画法,下面再为大家介绍一种效果更好看的画法。专注分享科研绘图技能与工具!好啦,今天先分享到这里啦~当然,之前的微信文章。原创 2023-07-06 01:37:38 · 2440 阅读 · 0 评论 -
浅析代谢组学最常用到的数据分析方法 图形详解pca pls-da opls-da
与PLS相比,OPLS根据数据集Y的差异将数据集X的差异分为两个部分,第一部分代表与Y相关的差异, 第二部分代表与Y不相关 (正交垂直)的差异,OPLS-DA可将这两部分差异进行区分,控制与Y正交或者无关的X的变化并加以滤除。代谢组学分析数据用于统计分析时,数据集通常为一个N × K的矩阵(X矩阵),N表示N个样本数,每一行代表一个样品, K表示K个变量,每一列代表一个变量,在代谢组学中变量通常是指代谢物含量。数据集X总会含有一些与研究无关的干扰信号,如人的生活方式,植物的生长环境或检测仪器的噪音干扰等。原创 2023-07-03 23:29:16 · 15284 阅读 · 0 评论 -
OPLS-DA分析,组间差异 图形详解
OPLS-DA分析,全称正交偏最小二乘法判别分析(OrthogonalPartialLeast Squares-DiscriminantAnalysis),它结合了正交信号矫正(OSC)和PLS-DA方法,能够将X矩阵分解成与Y相关和不相关的两类信息,通过去除不相关的差异来筛选差异变量。原创 2023-07-03 23:07:02 · 9883 阅读 · 0 评论 -
how to open this R project in ubuntu: 1 01:28 .RDataTmp linux中打开r project
最好先把相关包加载,原创 2023-03-03 21:07:25 · 295 阅读 · 0 评论 -
03 如何理解atac-seq中的peak
*原创 2023-02-09 23:11:41 · 3078 阅读 · 0 评论 -
scATAC-seq入门必看 染色质可及性 archr官网全流程
两种整合方法推断的基因表达与genescores化的图差不多确定细胞类型 celltype。原创 2023-02-09 23:07:01 · 1572 阅读 · 1 评论 -
nohup 输出到指定文件 Linux nohup 实现命令后台运行并输出或记录到指定日志文件 设置日志结果文件名称 重定向到某个文件 标准误 标准错误输出定向 输入报错信息保留2>&1 &
tailf 等同于tail -f -n 10,与tail -f不同的是,如果文件不增长,它不会去访问磁盘文件,所以tailf特别适合那些便携机上跟踪日志文件,因为它减少了磁盘访问,可以省电。tail -F 等同于–follow=name --retry,根据文件名进行追踪,并保持重试,即该文件被删除或改名后,如果再次创建相同的文件名,会继续追踪。# &是指在后台运行,但当用户推出(挂起)的时候,命令自动也跟着退出. nohup与&结合起来,可以实现不挂断的后台运行。tail 命令是nohup命令的好搭档。原创 2023-01-08 13:50:23 · 19121 阅读 · 0 评论 -
geo ftp环境变量 export source ~/.bashrc Linux中filezilla下载ftp文件 ftp.ncbi.nlm.nih.gov linux下载 ftp下载geo非原始数
show_all=1右键 检测(inspect)获得下载链接。原创 2023-01-02 16:09:21 · 192 阅读 · 0 评论 -
使用wget批量下载geo数据集的全部文件 linux下载geo数据 geo处理的数据不是下载原始数据 Linux如何下载ftp文件 geo ftp geo ftp下载 geo下载
发现其文件有点多,而且一个文件 就67G了,在自己的电脑里面操作的可能性很小,所以就直接去服务器处理吧。当然了,后续的分析才是苦难的开始,虽然咱有普通atac-seq技术打底,学一个新技术会很快,但该有的挫折感并不会少!wget: unable to resolve host address 无法解析主机host地址解决办法。感兴趣的小伙伴也可以跟我一样,批量下载它们的结果,然后开启下游分析哦!一个很简单的shell脚本,就可以得到全部文件如下所示;发布于 2021-09-30 23:21。原创 2023-01-02 16:09:31 · 1697 阅读 · 0 评论 -
mdsum如何检测文件完整性 检测下载是否完整
【代码】mdsum如何检测文件完整性 检测下载是否完整。原创 2022-12-30 19:08:42 · 401 阅读 · 0 评论 -
r中运行python 成功 从头开始 python环境
library(rmarkdown)#不运行就保存rmarkdown。##python清除所有变量_如何清空python的变量。原创 2022-12-28 12:25:15 · 527 阅读 · 0 评论 -
TclError: Can‘t find a usable init.tcl in the following directories
https://support.xilinx.com/s/article/51582?language=en_US原创 2022-12-27 16:54:41 · 2788 阅读 · 0 评论 -
scanpy学习 教程 就像seurat教程一样
Tutorials — Scanpy 1.9.1 documentation 教程汇总 所有关于scanpy的教程 Usage Principles — Scanpy 1.9.1 documentation 总的介绍 API — Scanpy 1.9.1 documentation 常用命令汇总总结 读取数据 Datasets读取数据集 内置数据集 https://scanpy-tutorials.readthedocs.io/en/latest/plotting/core.html sca原创 2022-12-27 13:40:17 · 973 阅读 · 0 评论 -
python变量清除所有变量_如何清空python的变量 注意缩进 python当前项目的变量 python console中用户创建的所有变量 %who python 查看所有已定义的变量
【代码】python清除所有变量_如何清空python的变量 注意缩进。原创 2022-12-27 12:57:46 · 215 阅读 · 0 评论 -
python r renv reticulate r中使用python 成功!!安装python环境 不需要安装conda环境r环境python环境
【代码】python r renv reticulate r中使用python 成功!!安装python环境 不需要安装conda环境。原创 2022-12-26 17:31:07 · 568 阅读 · 0 评论 -
vscode +Jupyter+子系统 python实战 windows系统下运行python写代码 windows子系统 window下Linux系统搭建
Windows Linux子系统(WSL),vscode+python+jupyter 开发环境搭建 - 简书原创 2022-12-24 21:11:51 · 272 阅读 · 0 评论 -
转座子 垃圾DNA是指DNA中不编码蛋白质序列的片段,是DNA中最神秘的部分之一。
例如,在染色质重塑中,对染色质蛋白的化学修饰导致染色质在基因组的某些区域变得狭窄,以致于这些区域中的基因和TE被沉默,因为转录酶根本无法访问它们。例如,Ac元件是自主的,因为它们可以自行移动,而Ds元件是非自主的,因为它们需要Ac的存在才能进行转置。转座子增加遗传多样性的能力,以及基因组抑制大多数TE活性的能力,导致平衡,使转座因子成为所有携带这些序列的生物中进化和基因调控的重要组成部分。同样,几年后,研究人员在同一个人的结肠癌细胞的APC基因中发现了L1,但在健康细胞的APC基因中未发现L1。原创 2022-12-14 16:15:12 · 788 阅读 · 0 评论 -
【无标题】
【代码】【无标题】原创 2022-12-08 17:08:26 · 864 阅读 · 0 评论 -
gsva gsea ssgsea单细胞 gaochao 使用GSVA方法计算某基因集在各个样本的表现
当 abs.ranking= TRUE时,将使用原始的Kuiper统计量,即使用极值的随机游走偏差和计算富集得分,该情况下,上调或下调的基因富集显著的基因集被认为是高度激活的;值得注意的是,这里的gsva函数接受的是一个纯粹的表达矩阵matrix和一个纯粹基因集合list,实际上通常是一个 ExpressionSet 和 GeneSetCollection 对象,所以大家务必学会R里面的对象哈,不然永远只能看懂简单代码。这样的差异分析结果同样也是可以画火山图,热图,代码就不赘述了,非常简单。原创 2022-12-08 14:42:38 · 2932 阅读 · 0 评论 -
流式 Isotype control 流式细胞仪control组
流式细胞术是非常让人着迷的实验。在众多医学研究手段里,如果说弱水三千只取一瓢的话,那我会首选流式细胞术。从我个人感受来讲,流式细胞术高速客观,具有统计学意义,能够处理复杂样本并同时获取多种参数,最最关键的是它性能可靠,可重复性非常好。虽然也存在一些局限,但流式细胞术比起传统的细胞生物学研究手段来讲完全可以获得「独孤求败」的桂冠了;如果算上共聚焦和膜片钳,当真可以算拉动现代细胞生物学的「三驾马车」了。什么是流式细胞术。原创 2022-11-28 10:55:53 · 2174 阅读 · 0 评论 -
标准流程surat subset_data allmerge Seurat流程 碎石图ElbowPlot harmony
【代码】标准流程surat subset_data allmerge。harmony yll原创 2022-11-17 15:16:12 · 283 阅读 · 0 评论 -
生存分析的图你也要拼接 图形拼接r 不同的图形组合在一起
因为都是ggplot体系的图表,很容易拼接,但是里面的生存分析是一个麻烦事情。再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成。出图,而这个survminer包出图并不是很稳定,但是学员自己解决了这个问题。你研究的基因凭什么重要(这才是数据挖掘的用武之地)的arrange_ggsurvplots函数对。多种数据结构(向量,矩阵,数组,数据框,列表)多种数据类型(数值,字符,逻辑,因子),感兴趣的可以自己去拼接看看哦!我们这里简单的展示如何用。两个变量都有生存意义。原创 2022-11-16 17:02:44 · 1093 阅读 · 0 评论 -
Invalid name supplied, making object name syntactically valid. New object name is Seurat..ProjectDim
see?原创 2022-11-16 16:55:06 · 2959 阅读 · 2 评论 -
r 相关性分析cor 对相关性分析进行散点图dotpot可视化
相关性分析用于评估两个或多个变量之间的关联。例如,如果我们想知道父亲和儿子的身高之间是否存在关系,可以计算相关系数来回答这个问题。如果两个变量(父亲和儿子的身高)之间没有关系,则儿子的平均身高应该相同,而与父亲的身高无关,反之亦然。注意,仅当数据呈时,才可以使用相关性分析。可以使用进行检查。请参看第六讲小编将描述几种相关性分析的方法,并提供示例。原创 2022-12-08 01:37:04 · 1230 阅读 · 0 评论 -
表达矩阵任意两个基因相关性分析 批量相关性分析 tcga geo 矩阵中相关性强的基因对 基因相关性 ecm matrisome与gpx3
1.已经确定研究的基因,但是想探索他潜在的功能,可以通过跟这个基因表达最相关的基因来反推他的功能,这种方法在英语中称为。2.我们的注释方法依赖于TCGA大样本,既然他可以注释基因,那么任何跟肿瘤相关的基因都可以被注释,包括长链非编码RNA。这时候,我们能推断PDCD1这个基因主要参与T细胞激活,细胞因子受体活性调剂等功能,大致跟她本身的功能是一致的。既然确定了相关性是正确的,那么我们用我们筛选的基因进行富集分析就可以反推这个基因的功能。这里因为是计算的所有GO分析的三个分类,所以可以合并作图。原创 2022-10-29 16:52:25 · 6464 阅读 · 2 评论 -
namespace ‘Seurat’ is not available and has been replaced by .GlobalEnv when processing object
重新安装相应的包 然后重新安装即可。原创 2022-10-26 07:16:53 · 760 阅读 · 0 评论 -
CIBERSORT 最全介绍 官网
用于芯片表达矩阵和测序表达矩阵,对未知混合物和含有相近的细胞类型的表达矩阵的去卷积分析优于其他方法 (LLSR,LLSR,PERT,RLR,MMAD,DSA)。注意Cibersort结果的默认文件名为CIBERSORT-Results.txt,在同一文件夹下进行第二次运算会覆盖第一次得到的文件,建议在每一次运算之后对文件重命名。CIBERSORT同时提供R包和在线网页工具,可以对用户的表达矩阵进行非负矩阵分解后计算不同细胞类型的比例。网页版有LM22的参考数据集,只需要提供表达矩阵文件就可以了。原创 2022-10-23 00:18:05 · 5806 阅读 · 0 评论 -
糖基化(glycosylation)
据估计,哺乳动物中的糖链大约有七千多种结构,其结构单体约为10种单糖(包括糖衍生物):葡萄糖(Glc)、半乳糖(Gal)、甘露糖(MAN)、木糖(Xyl)、岩藻糖(Fuc)、N-乙酰氨基葡萄糖(GlcNAc)、N-乙酰半乳糖胺(GalNAc)、葡萄糖醛酸(GlcA)、艾杜糖醛酸(IDOA)、唾液酸(SA)。末端糖化后,N-糖基化蛋白主要分为3种类型:含有全部9个甘露糖的高甘露糖型(high mannose)、含有其它糖基的杂合型(hybrid),以及含有唾液酸的复合型(complex)。原创 2022-10-20 14:42:53 · 5776 阅读 · 0 评论 -
R语言|4. 轻松绘制临床基线表Table 1 临床三线表绘制
age=年龄,age70=以70岁为界分组的年龄,race=种族,marry=婚姻,t=t分期,n=n分期,tnm=tnm分期,er=雌激素受体,pr=孕激素受体,her2,g=组织分级,sur=手术,rt=放疗,che=化疗,status=死亡否,time=时间。因涉及比较,所以在Table 1常将用该变量将全部人群分为几类,观察其他变量在这几个分类中是否有差异(p值)。原创 2022-10-15 17:16:13 · 13421 阅读 · 14 评论 -
基因表达量高低分组的cox和连续变量cox回归计算的HR值差异太大? km cox生存分析 多因素生存分析
现在有了《专辑》这个功能,其实更方便查看我们的历史教程啦。因为我五年前做生存分析研发这个代码的时候,就是根据基因表达量,把病人分成了高低表达两个组,不管是使用cox还是km,都是这样做的。但是最近有学生反映,使用cox还是km拿到的基因的生存效果是一致的, 就是风险因子和保护因子的分类问题。主要是靠HR值来判断咯。原创 2022-10-12 22:29:05 · 3077 阅读 · 0 评论 -
基因集合打分不考虑基因高低表达 基因集合评分不考虑高低表达 绝对值 基因集合里面的正负表达影响addmodulescore的结果 构建的基因集进行评分时 基因的高低正负表达基因集合评分不考虑高低表达
若p=1,则Phit的分母为基因集S中所有基因与性状的关联强度之和,基因集S中每个基因与该性状的关联都对该和进行标准化处理。S3:基因集S3非随机分布,但也并不在top or bottom呈现集中分布模式,ES值较高,但p值不显著。图例:①Phit= 基因集S中的加权和,Pmiss = 非基因集S中的加权和。S1:基因集S1主要分布在排序列表的top端,ES分值较高,p值显著;S2:基因集S2在排序列表中随机分布,ES值低,p值不显著;因此,富集分析的结果结果,要综合考虑p值及ES值两个指标。原创 2022-10-12 22:19:11 · 1036 阅读 · 0 评论 -
【无标题】
胶原纤维、蛋白聚糖、肌纤维、弹力纤维、纤维蛋白胶原组织疾病研et al.et al.染细胞质蓝染基质et al.结缔组织狭义上是指其含有的。结缔组织染色方法亦有很多种,如Masson三色染色法、Van+Gieson染色法、Gomori氨银法、Mallory磷钨酸苏木素染色,然而以上染色方法只是侧重于某一两种组织的染色。Russell改良Movat五色套染以其染色丰富、鲜艳而大受欢迎。该染色法主要用于显示动脉粥样硬化斑块。原创 2022-10-12 21:42:59 · 3245 阅读 · 0 评论 -
yll duqiang 制作geo三个独立数据集IPF基因集合 用于分析某个基因是否与生存期相关THBS2 mmp7
制作IPF基因集合 用于分析某个基因是否与生存期相关。原创 2022-10-09 17:42:27 · 411 阅读 · 0 评论 -
DT tableone各种花里胡哨的图 把dataframe导出成html 把矩阵变成html方便查看 类似于shinny功能 制作三线表等共功能 fextable 花里胡哨的工具 datatable
G:\r\tcga_example-master# 如果要生成word表格,如果安装成功了ReporteRs和rJavalibrary(dplyr)library(ReporteRs)原创 2022-09-29 17:06:16 · 315 阅读 · 0 评论