- 博客(138)
- 资源 (6)
- 收藏
- 关注
原创 零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(三)
提交后,如果这里出现报错,我们需要查看一下样本的对应关系,在前面的分析过程中,表达谱矩阵的样本有重复,所以出现部分样本没有在生存时间中出现,所以这里我们可以对生存数据的样本重新整理。打开文件tcga.T.dat.txt,转置这个很重要,未来区分,我们改一下名字tcga.T.dat1.txt。打开dat.mcp.select.txt文件,转置,并改名为dat.mcp.select.T.txt。运行成功后,下载数据,打开文件,转置(行列交换),并改名为tcga.T.dat1.txt。
2023-11-05 14:58:04
537
原创 零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(二)
提取TCGA的肿瘤组织的表达谱,在5.差异基因热图获取的group.txt和heatmap.exp.txt,打开group.txt,数据筛选,删掉N的样本,只有肿瘤组织的样本,另存为group1.txt(只保留第一列的样本名,去掉列名)。差异基因的获取,用excel的筛选工具,对volcan0.txt进行筛选(标准:logFC选择大于1或者小于-1,FDR
2023-11-04 11:59:21
1581
原创 零代码复现-TCGA联合GEO免疫基因结合代谢基因生信套路(一)
这时候保存一下,再用去重工具,去一下重复的基因,在前面处理的时候,我们将一个探针对应多个基因的去掉了,那么这里的基因重复就是多个探针对应一个基因名,可以选择去重方法进行去重,这里就省略了。A列的数据为基因ENSG号,可以直接删掉,C列的数据需要注意,代表了基因的类型,比如说这里选择蛋白编码的基因,将其他类型的全部删掉。到这里数据的准备阶段基本就做完了,需要注意的是,在分析的过程中药注意基因的表达,相差大的,可以取一个log进行后续的分析。这一部分为样本的表型数据,有时候,表型的临床是存在原文的附件中。
2023-11-04 10:26:24
961
原创 生信豆芽菜-预后之lasso分析
在最小二乘基础上增加了一个惩罚项来对估计参数进行压缩,当参数缩小到小于一个阈值的时候,就令它变为0,从而选择出对因变量影响较大的自变量并计算出相应的回归系数,最终能得到一个比较精简的模型。第一列为样本名,第二列为生存时间(可以是天/月/年),第三列为生存状态。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。第一个文件:行为基因,列为样本的表达谱矩阵,其实第一列不能重名;2、直接提交等待运行即可,默认是使用10倍交叉。第三个文件:进行lasso分析的基因。
2023-09-06 10:45:35
313
原创 生信豆芽菜-预后模型比较c-index计算
第三个文件:module中的特征基因(这里要注意,包含两列数据,第一列为特征基因,第二列为特征基因集来自于模型,这里可以用自己的模型与其他人构建的模型进行比较)当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据。2、输入图片的高度和宽度,提交等待运行结果即可。第一个文件:表达谱数据,行为基因,列为样本。第二个文件:生存数据。
2023-09-06 10:44:09
217
原创 生信豆芽菜-预后分析的森林图
需要准备一个单因素cox分析/多因素cox分析的结果文件,第一列为基因名,第二列为p值,第三列为HR,第四列为HR.95L,第五列为HR.95H。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、选择样式,输入图片的高度和宽度,点击提交等待运行结果。
2023-09-06 10:42:47
228
原创 生信豆芽菜-验证集构建风险模型
通过训练集计算的基因的coef系数,构建风险模型,其中默认对风险得分进行z-score,以0作为阈值划分高低风险组,绘制KM曲线。第二个文件:生存数据;第一列为样本名,第二列为生存时间(可以是天/月/年),第三列为生存状态。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。第一个文件:行为基因,列为样本的表达谱矩阵,其实第一列不能重名;第三个文件:基因和对应的基因系数。3、提交等待运行结果即可。
2023-09-06 10:41:28
178
原创 生信豆芽菜-机器学习筛选特征基因
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。第二个文件:分组信息,第一列为样本名,第二列为患者分组。这里选择是lasso,每一个基因对于分组的贡献。2、选择机器学习的方法,然后提交等待结果即可。第一个文件:特征表达数据。第三个文件:分析基因名。
2023-09-06 10:39:55
752
1
原创 生信豆芽菜-风险患者分布基因表达热图
2、选择划分高低风险的阈值,需要注意的是,前面在做riskscore的时候,我们进行zscore,所以这里选择0作为截断值,划分高低组。接着选择三组颜色,图片的高度和宽度,提交等待运行结果。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。第一个文件:基因表达的文件。第二个文件:风险得分的文件。
2023-09-06 10:38:38
172
原创 生信豆芽菜-二分类AUC绘制
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。网址:http://tbfollow.com/aucdrawing。2、提交后,等待运行结果。
2023-09-06 10:37:15
98
原创 生信豆芽菜-单/多变量cox分析
COX比例风险模型(cox proportional-hazards model)是英国统计学家D.R.COX于1972年提出的一种半参数回归模型,它可同时研究多个风险因素和事件结局发生情况、发生时间的关系,从而克服了简单生存分析中单因素限制的不足。第二个文件:生存数据;第一列为样本名,第二列为生存时间(可以是天/月/年),第三列为生存状态。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、选择单变量cox分析还是多变量cox分析,直接提交即可。
2023-09-06 10:35:59
267
原创 生信豆芽菜-XGboost构建诊断模型
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。网址:http://www.sxdyc.com/xgboostBuilds。2、提交等待运行结果即可。
2023-09-06 10:34:45
209
原创 生信豆芽菜-Km曲线
一个文件,三列,第一列为样本分组,第二列为患者生存时间(可以是天/月/年),第三列为生存状态。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、选择分组颜色,有几个分组选几个颜色,提交等待运行结果即可。
2023-09-06 10:32:57
157
原创 生信豆芽菜-AUC的计算和绘图
2、输入时间(如:这里我们上传的时间为年,输入的时间可以是1,2,3,4,计算的就是1,2,3,4n年的AUC),选择颜色(有几个数值选几个颜色,比如说这里计算了1,3,5三个数值,那么就选择三个颜色),选择图片的样式,线条是否光滑,提交等待运行结果即可。这里需要准备一个四列的数据,第一列为样本名,第二列为生存时间(可以是天/月/年),第三列为患者存活状态,第四列为风险得分(也可以是基因的表达)。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。
2023-09-06 10:31:32
156
原创 生信豆芽菜-113种算法组合构建诊断模型
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、选择两组颜色,提交等待运行结果即可。
2023-09-06 10:30:07
295
原创 生信豆芽菜-肿瘤干性评分的预测
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、提交后,等待运行成功即可下载。表达谱数据,行为基因,列为样本。
2023-09-06 09:45:19
142
原创 生信豆芽菜-血管生成评分的预测
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、提交后,等待运行成功即可下载。表达谱数据,行为基因,列为样本。
2023-09-06 09:44:01
102
原创 生信豆芽菜-信号转导通路相关评分的计算
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、提交后,等待运行成功即可下载。表达谱数据,行为基因,列为样本。
2023-08-23 11:04:11
194
原创 生信豆芽菜-缺氧评分的计算
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、提交后,等待运行成功即可下载。表达谱数据,行为基因,列为样本。
2023-08-23 11:02:58
166
原创 生信豆芽菜-单样本GSEA分析
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、提交后,等待运行成功即可下载。第一个文件:表达谱数据。第二个文件:功能基因集。
2023-08-23 11:01:56
198
原创 生信豆芽菜-EMT评分的计算
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、提交后,等待运行成功即可下载。表达谱数据,行为基因,列为样本。
2023-08-23 11:00:48
366
原创 生信豆芽菜-CRDscore计算评分
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、提交后,等待运行成功即可下载。
2023-08-23 10:59:42
275
原创 生信豆芽菜-柱状图加热图
2、选择分组的颜色,输入图片的高度,宽度,这里需要注意的是有一个阈值,通过该阈值对第一列风险得分划分高低组,可以选择输入median(中位数),mean(平均数),或者是other,这里需要输入具体的数值,提交等待运行成功即可。这里展示的随着风险得分的增加, 不同表型特征的分布,第一列为风险得分,后面几列为分组信息,不要出现连续型变量。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。
2023-08-23 10:56:38
79
原创 生信豆芽菜-样本分布比较的热图
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、设置图片的高度和宽度,提交等待运行成功。
2023-08-23 10:55:29
69
原创 生信豆芽菜-样本分布比较的圈图
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注豆芽数据分析。样本的分组信息,其中第一列为需要比较组,其他都是默认和第一个进行比较。2、输入图片的宽度和高度,选择颜色的类型,提交后,等待运行成功即可。
2023-08-23 10:54:01
62
原创 生信豆芽菜-桑基图
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。网址:http://www.sxdyc.com/visualsPlotSankey。2、设置图片的高度和宽度,提交等待运行成功。
2023-08-23 10:52:17
92
原创 【无标题】生信豆芽菜-临床特征三线表统计
2、输入比较组的名字,提交等待运行成功(这里要注意的是,根据我们上传数据的列明进行书写)当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。
2023-08-17 11:44:47
105
原创 生信豆芽菜-两组比较的柱状图
2、输入图片的宽度和高度,如果这里选择不转置,选择颜色,这里的颜色个数由输入数据第一列分组的个数决定,如果选择转置,选择颜色,这里的颜色个数由输入数据第二列分组的个数决定,当然,你可以多选几个颜色,他会自动选择前几个,提交等待运行成功即可。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。
2023-08-17 11:42:13
117
原创 生信豆芽菜-分组比较的表格
2、选择两个分组的颜色,有几个就选几个颜色,表头颜色,图片的宽度和高度,提交等待运行成功。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。如果颜色的个数不够,内部会自己补充颜色。两列的数据,最后比较这两组的样本分布。
2023-08-17 11:40:43
70
原创 生信豆芽菜-差异基因富集分析的圈图
2、选择富集分析的数据库,同时输入展示top几的条目,选择颜色,如果是GO的话选择三个颜色,如果是KEGG选择一个,如果是GOandKEGG选择4个颜色,可以多选,提交等待运行成功即可。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。准备一个基因集的文件。
2023-08-17 11:39:07
176
原创 生信豆芽菜-差异基因富集分析
该工具使用R 语言的clusterProfiler包对关键基因集进行GO和KEGG富集分析,注意这个的关键基因集可以是差异基因,WGCNA的module基因,也可以是表型相关的基因集。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。2、选择富集分析的数据库,GO/KEGG,提交后等待运行成功即可。准备一个基因集的文件。
2023-08-17 11:37:49
277
原创 生信豆芽菜-pRRophetic预测药物的敏感性
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。准备一个行为基因,列为样本的表达谱矩阵即可。2、直接提交等待运行成功即可。
2023-08-17 11:36:25
325
原创 生信豆芽菜-oncoPredict预测药物的敏感性
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。准备一个行为基因,列为样本的表达谱矩阵即可。2、选择训练集数据库,提交等待运行成功即可。
2023-08-17 11:35:05
996
原创 生信豆芽菜-细胞丰度占比图
当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,还可以关注:豆芽数据分析。这里需要上传一个行为样本,列为细胞评分的矩阵数据。直接提交就可以等待运行结果。1、如果是分组信息为空,则。2、如果分组信息不为空,则。
2023-08-17 11:28:09
108
原创 生信豆芽菜-细胞丰度比较
2、选择检验的方法,其中两组的可以选择用wilcox.test/test,三组的可以选择用kruskat.test/anova。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据。这里需要上传一个行为样本,列为细胞评分的矩阵数据。4、输入图例的标题,Y轴的标题图片的宽度和高度。3、分组的颜色,有几个分组选几个颜色。
2023-08-17 11:24:44
120
原创 生信豆芽菜-多种算法计算免疫浸润
它利用肿瘤组织的基因表达数据,通过分析特定的基因集合来估计不同免疫细胞亚群的相对丰度。5、Quantiseq(Quantitative Sequencing)是一种用于计算免疫细胞丰度的方法,它通过基因表达数据的定量测量来推断不同免疫细胞类型在样本中的存在程度。1、CIBERSORT是一种用于计算免疫细胞相对丰度的计算工具,可以通过分析基因表达数据估计复杂组织或血液样本中不同免疫细胞类型的相对丰度。使用基因表达数据和参考数据集,Timer通过比较样本中标记基因表达的模式,推断不同免疫细胞类型的相对丰度。
2023-08-15 16:36:21
667
原创 生信豆芽菜-TMEscore预测免疫浸润程度
使用TMEscore包预测患者免疫浸润程度;参考文章Cancer Immunology Research, 2019, 7(5), 737-750;当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。一个全编码蛋白的表达谱基因,其中行为基因,列为样本。一、TMEscore预测免疫浸润程度介绍。第一列为基因为行名,不能重复。
2023-08-15 16:35:04
345
原创 生信豆芽菜-TIP预测免疫
结果解释和分析:根据TIP的计算结果,可以得到肿瘤样本的免疫分数或免疫状态指数。它可以帮助研究人员评估肿瘤样本中免疫细胞的浸润水平,并对免疫治疗的潜在疗效进行预测,为个体化的免疫治疗提供参考。基因选择:TIP使用一组与免疫细胞浸润和相关免疫反应的基因来进行分析。这些基因通常与T细胞、B细胞、自然杀伤细胞、巨噬细胞等免疫细胞的免疫调控、浸润和功能相关。免疫状态预测:使用基因表达数据和基因选择集合,TIP通过数学模型和统计算法计算免疫分数或免疫状态指数,用以预测肿瘤样本中免疫细胞的浸润水平和整体免疫状态。
2023-08-15 16:33:54
610
原创 生信豆芽菜-TIDE分析
该工具主要有以下功能模块:预测反应(Predict Response):为每个肿瘤样本计算的TIDE评分可以作为替代生物标记物,预测对免疫检查点阻断的反应,包括黑色素瘤和NSCLC的抗PD1和抗CTLA4。2、选择肿瘤类型等等,这里需要注意是如果数据没有进行scale标准化,则需要选择在是否选择scale上选择yes。TIDE代表肿瘤免疫功能障碍和排斥,用于评估肿瘤样本基因表达谱中肿瘤免疫逃逸的可能性。当然,如果不清楚数据是什么样的,可以选择下载我们的示例数据,也可以关注:豆芽数据分析。
2023-08-15 16:32:42
1577
spell_picture3.1
2020-12-11
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人