- 博客(175)
- 收藏
- 关注
原创 单细胞LIANA受配体分析框架学习
单细胞RNA测序的快速发展激发了人们对细胞间通讯机制的研究兴趣。近年来,已有多种用于研究细胞—细胞通讯(CCC)的工具和数据库被相继开发。然而,这些方法通常是固定绑定的——每种分析工具往往只能与特定的资源配套使用——尽管从原理上讲,任何计算方法都可以与任意配体–受体数据库组合使用。为了解决这一限制,研究团队开发了liana框架,旨在将分析方法与资源解耦,从而实现灵活组合与扩展。
2025-11-30 21:06:13
376
原创 单细胞scITD张量分解分析工具
组织和个体水平的生物学过程通常涉及多种不同细胞类型的协同作用。然而,当前用于分析单细胞RNA测序数据的计算方法,并未设计用于捕获不同样本之间细胞状态的协同变化,这在一定程度上是由于大多数单细胞RNA测序数据集中生物学样本数量有限。近年来,样本复用技术的进步使得在群体尺度上进行单细胞转录组测量成为可能。为充分利用此类数据集,研究团队提出一种新的计算方法——单细胞可解释张量分解(single-cell Interpretable Tensor Decomposition, scITD)。
2025-10-12 22:11:50
559
原创 基于Seurat的空转单样本数据分析流程学习(六)-CNV分析
虽然这里说是基于Seurat,但其实主要还是把Seurat对象转化成了SPATA2这个包进行了分析。SPATA2是一个专门针对空间转录组数据(spatial transcriptomics)分析的R包,主要用于处理10x Genomics Visium或其他空间转录组技术的数据。它整合了单细胞转录组分析方法和空间信息,使用户可以在组织切片上可视化基因表达、细胞类型分布和空间模式。这个R包把inferCNV的功能给封装进来,使用起来更加方便,因此可以用这个包去做空转的CNV分析。
2025-10-12 22:07:53
630
原创 基于Seurat的空转单样本数据分析流程学习(五)-cellchat
CellChat是一个专门用于分析单细胞数据中细胞–细胞通讯的R包。它可以根据单细胞表达数据,结合配体–受体数据库推断细胞群体之间的信号网络,并为每个配体–受体对计算通信概率,同时通过置换检验评估统计显著性。此外,CellChat可进行网络分析,计算中心性、信息流向和信号强度,从而识别主要信号源和受体群体,并提供气泡图、热图、网络图以及空间可视化等多种方式展示细胞间通讯。
2025-09-28 14:24:50
1758
原创 Scissor工具常见报错及解决
最近有小伙伴问起Scissor工具的报错,因此就再次回顾一下。目前在很多分析中都会用到Scissor法,但由于Scissor法目前没有更新还是最兼容Seurat V4版本。如果要在Seurat V5中使用时,需要注意和修改两句代码。既往流程:Scissor算法-从含有表型的bulkRNA数据中提取信息去鉴别单细胞亚群 https://mp.weixin.qq.com/s/yUaeJKpuF1NzaD0fnhhUuQ。
2025-09-21 12:57:22
500
原创 TMEclassifier免疫微环境分类工具学习
TME 分类器是一种基于胃癌肿瘤免疫微环境特征进行肿瘤微环境分类的R包。TMEclassifier 旨在对胃癌乃至其他癌症的肿瘤微环境(TME)进行分类。该软件包包含一个集成分类模型,融合了 6 种机器学习算法:支持向量机(SVM)、随机森林(RF)、神经网络(NNET)、k 近邻(KNN)、决策树(DecTree)以及极端梯度提升(XGBoost)。TMEclassifier 基于134个TME相关基因的表达谱和集成模型,识别出三种TME聚类。
2025-09-21 12:53:20
494
原创 基于Seurat的空转单样本数据分析流程学习(四)-hdWGCNA
hdWGCNA全称是high-dimensional Weighted Gene Co-expression Network Analysis,即高维加权基因共表达网络分析。它是对经典的WGCNA(Weighted Gene Co-expression Network Analysis)方法的扩展和优化,专门适配单细胞转录组(scRNA-seq)和空间转录组(ST)数据。
2025-09-21 12:45:42
602
原创 基于Seurat的空转单样本数据分析流程学习(三)-SpaCET
前面的内容回顾了空转单样本的分析流程、RCTD和SPOTlight的分析流程。本次学习一下SpaCET这个工具。SpaCET用于估算肿瘤微环境中的细胞谱系组成和细胞间相互作用。简而言之,SpaCET首先通过整合常见恶性肿瘤的基因模式字典来推断癌细胞丰度。随后,SpaCET采用约束线性回归模型校正局部组织密度,并基于全面的非恶性细胞图谱来确定基质和免疫细胞的谱系比例。此外,SpaCET还能揭示肿瘤微环境中潜在的细胞—细胞相互作用,尤其是在肿瘤—免疫界面处。
2025-09-14 08:46:20
692
原创 基于Seurat的空转单样本数据分析流程学习(二)-SPOTlight
上一篇推文采用了RCTD工具,本次我们使用SPOTlight映射,SPOTlight 是一种用于解析(去卷积)细胞类型及其在每个捕获位置中所占比例的工具,这些位置通常由多种细胞混合组成。该方法最初是为 10X Visium 空间转录组学技术开发的,但它同样适用于所有能够返回细胞混合信号的技术。SPOTlight 的核心原理是:通过 NMFreg 模型学习每种细胞类型的主题特征(topic profile signatures),然后寻找能够最佳拟合目标点(spot)的细胞类型组合。
2025-09-12 12:24:12
1276
原创 单细胞scDblFinder异质性双细胞检测学习
相比之下,。研究者还提供了其他研究团队得到的bencmark结果,scDblFinder在平均 AUPRC 和 AUROC 值上表现最佳,并且在 10%识别率下,其精确率(precision)、召回率(recall)和真阴性率(TNR)等指标也位居首位。
2025-09-11 12:21:51
600
原创 基于Seurat的空转单样本数据分析流程学习(一)
在空间转录组分析中,必要的文件包括 filtered_feature_bc_matrix.h5(基因表达矩阵)、tissue_positions_list.csv(spot的空间位置信息)、scalefactors_json.json(坐标与图像的缩放比例)以及 tissue_lowres_image.png 或 tissue_hires_image.png(组织切片图像,用于可视化)。包括 spot 的条码、是否位于组织区域(1=组织内,0=背景)、芯片阵列上的行列位置以及在图像中的像素坐标;
2025-08-31 10:32:34
1060
2
原创 CellphoneDB的分析流程(方法二)学习
CellphoneDB 是一个用于分析单细胞转录组数据中细胞-细胞通讯的数据库和计算工具。它基于细胞中表达的配体(ligands)和受体(receptors)来推断不同细胞类型之间的相互作用。CellphoneDB的分析方法一共三种,其中最常用的可能是第二种分析方法:方法1-简单分析(>= v1):不进行统计分析。CellphoneDB 将输出每种细胞类型组合间所有相互作用的平均值。
2025-08-03 14:56:19
1382
原创 数量和比例气泡图学习(Python版)
通常在做数据分析的时候需要判断一下不同细胞类型/成分在样本或者分组中的数量和百分比,那么气泡图也是其中一种实用的方式。在R语言中一般会采用gplots::balloonplot去实现这个过程,而Python中可使用seaborn进行绘制。
2025-07-28 15:44:17
522
原创 inferCNVpy分析流程学习
inferCNV的用途大家都已经很清楚了,接下来就走一下流程,试一试Python版的inferCNV。使用的数据集为:GSE188711,既往推文可见:Scanpy分析全流程(含harmonypy整合/细胞周期矫正/双细胞检测及去除)(
2025-07-22 17:32:09
841
原创 Apriori关联分析学习(arules包)
R语言中的arules包系列为表示、处理和分析事务数据与模式提供了基础架构,基于频繁项集(frequent itemsets)和关联规则(association rules)进行挖掘。该包不仅实现了多种兴趣度量指标和关联规则挖掘算法,还集成了Christian Borgelt提供的高效Apriori和Eclat C语言实现版本的代码。
2025-07-14 23:38:07
327
原创 单细胞数据的差异分析及火山图绘制(Python)
既往内容基于Python绘制了纵向、横向和比例条形图(柱状图):https://mp.weixin.qq.com/s/n_JCFlg0_FaoQJEmrrWu9A。本次基于Python绘制一下火山图,R语言版本的差异分析及火山图绘制也在既往的推文中出现过:https://mp.weixin.qq.com/s/L98KtJH5-l4mF0n9dOIsxQ。
2025-06-16 16:59:21
615
原创 复杂多样本10X单细胞数据整理及读取流程(Python)
其实,如果数据很少的话可以选择手动整理。既往整理过R语言版本的读取流程:常见不同单细胞数据类型的读取及Seurat对象创建方法整理(单多样本/10X/h5/txt/csv/tsv),https://mp.weixin.qq.com/s/p32aRJcBdyoBi1kooYO2LA。
2025-06-13 00:54:01
699
原创 GEO数据库中单细胞数据下载中断或太慢?多种下载/提速方法汇总
在GEO网站上直接点击下载数据时,可能会遇到下载中断或速度过慢的问题,此时可以尝试以下几种替代方法来获取数据。
2025-06-12 10:19:48
2326
原创 Minifoge安装及其使用学习(Mac/Apple Silicon ARM64 架构)
Apple silicon arm64架构的用户可能更适合使用miniforge。
2025-06-11 10:39:22
470
原创 单细胞数据的纵向、横向和比例条形图(柱状图)绘制(Python)
在R语言中有个强大的R包ggplot2,它能够帮助我们完成很多绘图工作,方便又好用。Python环境中用于绘图可能会比较常用mamatplotlib,seaborn,plotly以及ggplot(Python),本次就用mamatplotlib和seaborn来进行横向和比例条形图的绘制。R语言版本的横向和比例条形图也在既往的推文中出现过:https://mp.weixin.qq.com/s/nuFHE4AyUMsBvbGbEhDxBg。
2025-06-10 20:35:29
723
原创 单细胞CellBender去除环境RNA污染学习(Python)
CellBender用于从高通量单细胞组学数据中消除技术伪影,包括scRNA-seq、snRNA-seq和CITE-seq。尽管近年来在改进、优化和标准化基于微滴的单细胞组学实验(如单细胞RNA测序,scRNA-seq)协议方面取得了进展,但这些实验的复杂性仍导致原始数据中存在系统性偏差和背景噪声。这些干扰主要来源于不期望的酶促反应产生的伪造文库片段、外源或内源环境转录本的污染、条形码微珠的杂质,以及扩增和/或测序过程中发生的条形码交换。
2025-06-09 21:22:17
1496
1
原创 CEL结尾的芯片数据处理方法(oligo和affy)学习
oligo和affy这两个包都能够处理CEL结尾的芯片数据,但是适用性存在一定的差别。让大模型帮忙整理了一下。感觉回答的还挺好。
2025-06-05 23:53:04
409
原创 Seurat和h5ad数据相互转化以及10X多样本数据整理和读取(Python)
目前已完成基于R语言的单细胞分析实战系列,涵盖初级、中级和高级三个阶段(每个阶段暂时各包含4篇内容,后续将陆续更新)。接下来,将尝试开展基于Python的单细胞分析实战系列。但在系列内容正式开始之前,笔者认为有必要先学习一下数据转化和读取流程。本次内容涉及到的工程文件可通过网盘获得:中级篇2,链接: https://pan.baidu.com/s/1y-HHLXoXsJbgWKCdz26-gQ 提取码: yx93。
2025-05-18 22:06:06
2326
原创 数据下载工具-aria2c学习
aria2可以从多个来源和协议同时下载同一个文件,也可以同时下载多个文件,线程数最大是16,最大限度地利用你的下载带宽。-j,--max-concurrent-downloads=N,最大并行下载任务数,适用于HTTP/FTP、torrent和Metalink文件,默认是5可以往上调整。最后就可以下载,下载速度真的很快,但多样本同时下载的时候可能会出现下载失败,因此要多重复代码,确保最后显示所有的文件都下载成功。-s,--split=N,分片数,一个文件最多拆成N个部分并发下载,默认值是5。
2025-05-15 09:36:49
906
原创 单细胞实战之单细胞非负矩阵分解(cNMF)——入门到进阶(高级篇4)
接下来将回顾学习非负矩阵分解这个工具, 单细胞实战之单细胞hdWGCNA分析——入门到进阶(高级篇3):https://mp.weixin.qq.com/s/KGSoRx3klmliKPVL7ml28Q该工具能够辅助研究者去判断细胞亚群的关键标志物,也可以对未分群的细胞进行分群。而非负矩阵分解有R语言版本,但是其运行速度极其缓慢,因此本次实操选择了python版。其具体的原理可以看一下参考资料中的文献。
2025-05-11 23:45:02
1137
原创 单细胞RNA速率(velocyto)分析学习(二)
在动态变化过程中,转录速率α的升高会引发未剪接mRNA的快速增加,随后驱动剪接mRNA的累积,直至系统达到新的稳态。成熟RNA:代表已经完成转录并经过剪接的RNA,反映了基因的表达状态。通常情况下Seurat对象的数据已经是处理过之后的细胞亚群数据了,里面包含了很多信息,比如图聚类等,因此需要根据seurat的barcodes修改loom文件的barcodes(而不要根据loom文件去修改seurat),因此这也提示我们在最开始构建Seurat对象数据的时候要养成习惯把样本名称尽量处理的简洁一点。
2025-05-10 16:29:14
1671
原创 单细胞RNA速率(velocyto)分析学习(一)
创建新文件夹# 移动文件到该文件夹中# 查看所有以fastq.gz结尾的文件,并统计数量# 删除GSM开头的文件夹。
2025-05-08 22:57:24
1673
原创 单细胞scRank药物反应推断工具学习
scRank是一种利用目标扰动基因调控网络(target-perturbed gene regulatory networks, tpGRN)对未处理scRNA-seq数据中的药物扰动进行建模和评分的药物响应细胞类型推断方法。开发者是基于以下两点进行假设:1.不同细胞类型的内在细胞状态可以通过细胞特异性基因调控网络(GRN)反映出来;2.细胞中的药物(抑制剂)扰动可以建模为GRN中药物靶基因节点的缺失,进而导致全局或局部效应。因此该工具可以探索。
2025-04-21 20:49:15
815
原创 单细胞实战之CytoTRACE2和monocle3——入门到进阶(高级篇2)
cellTRACE2+monocle3+ClusterGVis 轨迹分析小连招。
2025-04-20 00:25:25
3055
原创 Dependency Map(DepMap)数据库学习
在DepMap中,利用大规模功能基因组学分析来识别细胞生长所必需的基因。迄今为止,已在超过1000种癌细胞模型中完成了RNA干扰和CRISPR基因敲除筛选。与此同时,采用多重分析方法对数百种细胞模型进行药物敏感性分析。在完成药物重定位化合物库的筛选后,持续对具有研究价值的新化合物进行表征,以创建迄今规模最大的肿瘤学研究参考数据集。该工作的核心是开发新型分析工具,以更精准地捕捉这些遗传依赖性和药物敏感性。
2025-04-02 23:31:45
3006
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅