自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Mime机器学习

C-index是一种衡量生存分析模型预测准确性的指标,值越接近1表示模型预测的准确性越高。点击External data,进入后点raw下载数据。*list_train_vali_Data 数据集:结构与train_data一样。其他列是基因名:其表达量为 用log2(x + 1)缩放的基因表达水平。*建议训练数据集包含超过 100 个样本,基因集包含超过 50 个基因。第一列是样本名(样本ID);HR:风险比,主要用于生存分析,即。置信区间:有95%的概率包含真实值。查看其中Dataset1数据集。

2024-12-01 22:19:32 252

原创 Seurat基础分析

左上角的点可能与细胞异质性和特定细胞亚群的标识有关,而右上角的点可能与更广泛的细胞功能和调节有关。,其中左上角的点(低平均表达水平和高方差)通常指的是那些在少数细胞中表达量很高,而在大多数细胞中表达量很低的基因。相反,右上角的点(高平均表达水平和高方差)则指的是那些在所有或大多数细胞中普遍表达,但表达量变化大的基因。这些基因可能参与一些基本的细胞过程,或者在不同细胞中因应不同的生理状态而表现出不同的表达水平。:通过观察每个主成分的方差解释程度,可以找到一个“肘点”,即主成分的方差贡献开始显著下降的点。

2024-10-31 21:35:06 962

原创 生物信息学知识

GEO数据有五种:Platform (平台)、Samples (样本)、Series (系列)、DataSet (数据集)、Profile(基因表达谱)。平台为“GPL+数字”,样本为GSM+数字,系列为GSE+数字,数据集为GDS+数字。

2024-02-26 22:43:46 1766

原创 不是maf格式的somatic突变数据就没办法读入到maftools了么

因为使用的是百度李彦宏的文章数据,大家会比较倾向于处理tcga的肿瘤突变数据,虽然仅仅是输入数据的不一样,后续分析都是靠 maftools 这个包,maftools 全能无需我再吹嘘,必须花十几个小时认真掌握它! 假如大家是在 https://xenabrowser.net/datapages/ ,找到 GDC TCGA Breast Cancer (BRCA) (20 datasets) ,数据库提供了4种somatic突变的maf文件供下载,somatic mut...

2021-10-06 17:45:18 904

原创 maf文件内容简介

原文章网址:https://mp.weixin.qq.com/s?__biz=MzIwODA1MzI4Mg%3D%3D&chksm=809f90a0b7e819b6e40d2fa0718ee3a022dad989f884c134d374e5a2f4504d85d2f8a408a3ef&idx=1&mid=2456012269&scene=21&sn=a84dd0a5b42c50f897341f0722bb9352#wechat_redirect ...

2021-10-06 17:26:15 3357

原创 2021-08-21 类器官单细胞图谱

阅读文章原网址:https://mp.weixin.qq.com/s/-4ezuQGRN9tM2R08Cb9S2Q目录1.类器官定义2.类器官的用途3.文章大意1.类器官定义 类器官属于三维(3D)细胞培养物,包含其代表器官的一些关键特性。此类体外培养系统包括一个自我更新干细胞群,可分化为多个器官器官特异性的细胞类型,与对应的器官拥有类似的空间组织并能够重现对应器官的部分功能,从而提供一个高度生理相关系统。(简单来说,将患者的正常细胞或肿瘤细胞在体外进行培养...

2021-08-21 15:27:46 482

原创 2021-07-21 harmony整合不同平台的单细胞数据

counts<-ileum@assays[["RNA"]]@counts##提取countsrecepters_lin<-ileum[c("ACE2","DPP4","ANPEP","CEACAM1"),]##提取特定基因的countstable(Idents(recepters_lin))gene11=recepters_lin[1,which(recepters_lin@active.ident=="Paneth")]a1=sum(gene11@assays$RNA@cou..

2021-07-21 02:16:10 2507 1

原创 2021-07-10 FindMarkers与AverageExpression 两个函数的差异

library(Seurat)sce=ileum##ileum为创建的Seurat对象dim(sce)##[1] 17284 5301 行为基因名,列为细胞名table(sce$seurat_clusters)## 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ##629 571 415 367 364 359 336 262 259 259 230 226 219 163 153 149 132 .

2021-07-12 05:36:29 3521 2

原创 2021-06-27 barplot绘制堆积条形图

首先我们先看一下原始数据然后我们绘制堆积条形图#读取数据a <- read.table(file="sample_bacteria_percentage.txt",sep="\t",header=T,row.names=1)#生成png图片,删除之前的堆积柱形图png(file="before.png",width=560,height=400)#设置图片右边空白宽度,稍微宽一些,可以放置图注par(mar=c(5,4,4,10))#绘制堆积柱形图,样本名字垂直摆放,利用..

2021-06-27 22:26:51 1003

原创 2021-06-27 ggplot2绘制堆积柱形图

#1、设置路径setwd("C:\\Users\\23217\\Desktop\\test")#2、加载原始数据library(ggplot2)raw=read.table("sample_bacteria_percentage.txt",header=T,sep="\t")原始数据如下图,列为各样本名,行为分类library("reshape2")#将数据以class为分类标准重新整合data=melt(raw,id="class")整合完成的数据p=ggp..

2021-06-27 18:36:24 1642

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除