cytotrace有网页端和R包。
web端分析,分为单个dataset和多个需要整合的dataset.单样本主要用CytoTRACE功能,多样本、多batch、甚至10x和smart-seq2这种不同平台的,用conbat进行批次效应去除。
对于前者(单样本)需要:
1,表达矩阵,首行为细胞名,首列为基因名。不要pre filter genes,也不要normalization(但是log2,TPM可以,只要表达量不要出现负值就行)
A1那格可以瞎填一个

2,phenotype table。第一列是细胞id,与表达矩阵相对应。第二列是cell label。注意此表不要包括headers

对于后者(多个样本),每个dataset各自准备好上述两个文件即可,多余5个dataset只能用R包分析。
代码版:
不少单细胞的包本身集成了python模块的机器学习,学好R reticulate包可以无痛安装这些包
install.packages("devtools")
devtools::install_local("CytoTRACE_0.3.3.tar.gz")
library(reticulate)
conda_list(conda = "auto")
conda_create("cytoTRACE", python_version = '3.7')
use_condaenv("cytoTRACE")
conda_install("cytoTRACE","numpy")
py_install(packages = "scanoramaCT", pip = T)
library(CytoTRACE)
dim(marrow_10x_expr)
marrow_10x_expr[1:4,1:4]
table(marrow_10x_pheno)
dim(marrow_plate_expr)
marrow_plate_expr[1:4,1:4]
table(marrow_plate_pheno)
#选择一个数据集走cytoTRACE
marrow_10x_expr_results <- CytoTRACE(mat = marrow_10x_expr)
plotCytoTRACE(marrow_10x_expr_results,
phenotype = marrow_10x_pheno)
?plotCytoTRACE
#两个不同测序方法的dataset进行整合
datasets <- list(marrow_10x_expr, marrow_plate_expr)
results <- iCytoTRACE(datasets)
plotCytoTRACE(results,
phenotype = c(marrow_10x_pheno,marrow_plate_pheno),
gene = "Top2a")
CytoTRACE提供网页端和R包两种方式进行单细胞数据分析,包括单个和多个样本的处理。单样本分析主要使用CytoTRACE功能,而多样本分析则通过conbat消除批次效应。在使用CytoTRACE时,要求输入表达矩阵和表型表,矩阵不需预过滤基因或归一化,但建议进行log2转换。如果样本超过5个,则需借助R包进行分析,R的reticulate包有助于集成Python模块的机器学习应用。
6234

被折叠的 条评论
为什么被折叠?



