- 博客(58)
- 收藏
- 关注
原创 CellOracle·单细胞扰动模拟
CellOracle是一种结合计算扰动与基因调控网络(GRN)建模的策略,用于模拟转录因子(TF)扰动后细胞身份的变化,并为细胞身份的调控提供系统性和直观的解释。2. 计算转录因子扰动对目标基因表达的影响:利用GRN模型,模拟转录因子KO或过表达时基因表达的变化,进而推算出基因表达相对趋势变化。4. 二维向量化转变概率:将转变概率转化为加权的局部平均向量,并通过降维得到二维向量,直观地展现细胞身份的变化方向。3. 估算细胞身份转变的概率:通过比较基因表达的变化与局部邻域基因表达,估算细胞身份转变的概率。
2025-03-27 16:21:17
248
原创 Homer·预测给定基因的转录因子
Homer通过 的链条,将基因功能与调控机制关联,适用于转录组、表观组及功能基因组学的整合分析。其中函数的核心思想是:通过比较 的启动子区域与 的启动子,识别目标基因中显著富集的转录因子结合基序(motif)。使用方法:(基因名支持Symbol/Ensembl ID等)2. 运行findMotifs.plfindMotifs.pl 需要 3 个强制性参数: 基因 ID 输入文件,物种类型,输出目录3. 查看结果,含p值、motif序列等。
2025-03-27 16:20:40
330
原创 GSPA·单细胞基因信号模式分析
在单细胞测序分析中,已有多种计算方法用于映射细胞状态空间,但基因空间的映射或嵌入研究较少。基因表达存在高度组织和协调,但由于生物和技术噪声的影响,难以量化基因间的相似性,阻碍了对基因景观的理解。
2025-03-04 13:02:06
298
原创 HistoCell·从组织学图像推断细胞空间分布
HistoCell 是一种弱监督、无需人工标注的深度学习方法,旨在从组织学图像推断超分辨率细胞空间分布,包括细胞类型、细胞状态及其空间网络。其核心在于构建预训练模型,通过解耦组织学图像中细胞形态特征与空间转录组数据中的去卷积细胞组成,实现高精度细胞空间解析。量化预测结果与 ST 去卷积细胞组成的相似性,验证 HistoCell 在 Spot 级细胞组成预测中的准确性。,表现出更高的预测精度,尤其是在低丰度细胞类型(如 T 细胞、髓系细胞和基质细胞)上的预测能力更强。获取细胞间的空间拓扑关系。
2025-03-04 13:01:32
790
原创 GASTON·空转的基因表达地形图
该算法能够同时学习等深度、空间梯度以及基因表达的分段线性函数,从而对基因表达的连续梯度和离散变化进行建模。:引入 “等深度”(isodepth)这一标量,等深度的等值线将组织切片划分为不同的空间域,并确定域内各位置的相对位置。等深度的梯度表示基因表达在空间中的最大变化方向。• 过程:通过深度神经网络,利用无监督学习,计算等深度和空间梯度,网络中的一个可解释隐藏层用于表示等深度值。• 基因表达建模:基因表达被建模为等深度的分段线性函数,能够同时捕捉连续的基因表达梯度和域间离散变化。
2025-02-12 11:10:48
345
原创 DTNE·单细胞数据降维新方法
该算法不仅能够保留高维数据的地质距离,还能够进行降维、拟时序推断和细胞聚类分析,帮助研究者深入挖掘细胞之间的关系和动态变化。传统的降维方法,如UMAP和tSNE,通常只能在低维空间中可视化数据,但会丢失重要的结构信息,特别是当数据存在复杂的非线性关系时。:基于流形距离矩阵,DTNE可以执行关键的分析任务,如降维、拟时序推断和聚类分析,从而帮助研究者深入挖掘数据中的生物学信息。:DTNE算法的核心是将欧几里得空间中的直线距离转化为流形空间中基于分布的地质距离,从而更准确地表示细胞之间的关系。
2025-02-12 11:10:19
173
原创 OmicVerse·Bulk+scRNA-seq的综合转录组分析框架
OmicVerse 是一个集成的 Python 框架,旨在简化和增强批量 RNA 测序(Bulk RNA-seq)和单细胞 RNA 测序(scRNA-seq)的分析。它通过整合多种分析工具,为用户提供一致且用户友好的界面,使得在一个编程环境中即可进行全面的转录组分析。
2025-01-13 11:54:50
606
原创 CellCharter·空间生态位分析工具
• 簇形态学特征:测量簇的边界、面积、周长、主要和次要轴,计算弯曲度(curl)、拉长度(elongation)、线性度(linearity)和纯度(purity)。最近用它来做空间邻域分析还挺方便的。4. 特征聚合:对每个细胞/spot,将其自身的特征与其l邻域的特征(按距离逐层聚合)进行拼接,生成新的特征向量。• 簇邻域富集分析(Cluster NE):识别簇之间的空间相邻关系,包括对称和非对称富集关系。• 研究细胞空间分布、簇的空间关系和形态学特征(如癌症微环境中的细胞群落)。后续会分享具体用法!
2025-01-13 11:54:39
596
原创 CrossChat·检测细胞间通信中的全局和局部层次结构
传统分析方法常局限于预定义的细胞类型,并且只关注单一尺度的细胞间通讯,这忽略了由配体和受体基因表达所定义的细胞内在层次结构,且无法捕捉多尺度细胞状态和跨尺度通讯模式。为了克服这些限制,我们推出了CrossChat,这是一种新的方法,它利用单细胞和空间转录组数据全面解析CCC的全局和局部层次结构,揭示跨尺度的细胞群体通讯机制。:根据层次聚类树定义配体簇和受体簇,并使用CellChat计算不同细胞簇之间的配体-受体通讯活动。:通过余弦相似性计算细胞间的相似性矩阵,构建K近邻图,节点代表细胞,边权重表示相似性。
2024-12-17 15:37:29
510
原创 CellANOVA·细胞状态空间方差分析
是一种统计方法,专为单细胞数据设计,旨在从整合后的数据中显式量化批次效应,并恢复整合过程中可能被抹去的生物学信号。它通过利用控制池样本的实验设计,精确地将批次效应与生物学变异区分开,为单细胞数据分析提供了更高的灵活性和准确性。:CellANOVA 能够根据细胞的转录组状态估计批次效应,允许批次效应在不同细胞类型间的异质性。:对整合后的数据矩阵进行奇异值分解(SVD),得到细胞状态编码,用于表示不同细胞状态的空间位置。:在批次校正的同时恢复被传统整合方法抹去的生物学信号,支持更精确的下游分析。
2024-12-17 15:36:07
424
原创 BANKSY·细胞分型与组织域分割的空间聚类算法
总之,BANKSY 是一个融合空间和基因表达信息的聚类方法,能够在细胞类型识别和组织域分割之间灵活切换。• BANKSY 不仅使用单个细胞的基因表达信息,还计算细胞邻域的基因表达均值(mean neighborhood expression)以及梯度方向场(AGF,expression gradient field)。• BANKSY 构建一个增强的邻域空间,将细胞的表达信息与其邻域信息结合,形成一个新的特征空间。它通过结合细胞的基因表达信息与其空间微环境特征,将细胞嵌入一个增强的空间中,并进行聚类分析。
2024-11-27 14:46:58
629
原创 Niche-DE·空间转录组数据中的微环境差异基因表达分析
Niche-DE 是一种新的统计分析方法,用于发现特定细胞类型的基因表达在其局部微环境(即邻域细胞类型组成)的影响下的显著变化。此外,Niche-DE 可与 Niche-net 的配体-受体分析结合,进一步解析细胞间的信号通路。使用高斯核函数计算每个细胞与其他细胞的相似性,生成一个特征向量(维度等于细胞类型数)。• 对每个细胞类型和基因,构建回归模型,测试基因表达是否与邻域细胞类型组成相关。• 第三层:若显著,进一步测试基因是否在与特定邻域细胞类型相关时显著。
2024-11-27 14:46:21
360
原创 CytoSPACE·空转和单细胞数据的高分辨率比对
表格应包含两列,其中第 1 列包含与 scRNA-seq 矩阵的列对应的单个细胞 ID,第 2 列包含相应的细胞类型标签。矩阵必须是基因(行)乘以细胞(列)。第一行必须包含单个细胞 ID,第一列必须包含基因名称。第一列(基因名称)必须有标题。由 3 列组成的表格,其中第一列包含与 ST 基因表达矩阵的列相对应的 ST 点 ID,第 2 列和第 3 列分别包含每个 ST 点的行和列索引。矩阵必须是基因(行)乘以 ST 点(列)。第一行必须包含 ST 点 ID,第一列必须包含基因名称。
2024-11-04 13:35:54
533
原创 CytoSPACE·单细胞与空间转录组的高精度对齐
3. 与通常在预选标记基因或共享嵌入空间上运行的其他方法(后者可以消除真正的生物变异)不同,CytoSPACE 使用完整的转录组而无需进行批量校正,从而帮助它保持对细微细胞状态的敏感性。1. 与按点计算细胞类型分解的传统方法不同,CytoSPACE 可生成具有高基因覆盖率和适合下游分析的空间解析 scRNA-seq 数据的重建组织标本。1. 应用现有的ST去卷积方法(如Spatial Seurat或RCTD),使用参考数据集B中的细胞类型特征来估算ST数据集A中的细胞类型比例。
2024-11-04 13:35:38
458
原创 ActivePathways·多组学数据的定向整合与通路富集分析
它通过数据融合方法整合多个组学数据集,基于信号的显著性和方向性优先排序基因,并对这些优先排序的基因进行通路富集分析。通过ActivePathways,可以发现由单一或多个组学数据集支持的通路和基因,以及仅通过数据整合才能检测到的额外基因和通路,这些在单一数据集中是无法发现的。:将上游组学数据集处理为基因P值矩阵和基因方向矩阵(如图1A所示)。:合并后的基因列表使用ActivePathways方法中的排序超几何算法进行通路富集分析,这个算法还可以确定哪个输入组学数据集对单个通路的贡献最大(如图1B所示)。
2024-10-15 09:55:48
714
原创 单细胞|hdWGCNA·共表达网络
fraction:使用在整个数据集或每组细胞中以一定比例的细胞表达的基因,由 group.by 指定;variable:使用存储在 Seurat 对象的 VariableFeatures 中的基因;group_name是想要分析的细胞亚群的名称,可以是一个,也可以是一个集合。custom:使用自定义列表中指定的基因。获取模块分配表,提取排名靠前的hub基因。加载数据集和所需的包,检查输入数据。4. 共表达网络分析,选择合适阈值。3. 构建metacell。5. 计算模块特征基因。6. 计算模块连接性。
2024-10-15 09:55:14
854
原创 报错记录:cellchat netEmbedding函数
1. conda中存在独立的r-reticulate环境,没有的话自己创建一个,并且R中调用的路径一致。2. r-reticulate环境中安装umap包。3. 安装成功即可在R中调用。
2024-08-26 14:17:47
499
原创 hdWGCNA·单细胞数据中的共表达网络
WGCNA 是一种用于识别基因共表达模块(即在多个样本中共同表达的基因群体)的方法,它能够将基因表达数据与外部表型数据或样本特征联系起来。通过以上步骤,hdWGCNA 能够在单细胞和空间转录组数据中识别基因共表达模块,揭示细胞类型特异性基因表达模式,并在大规模数据集上具有良好的扩展性。:对每个基因模块计算模块特征基因(ME),即该模块基因表达矩阵的第一主成分。MEs 可以代表整个模块的表达模式,用于后续分析。:根据基因-基因相关性矩阵计算基因之间的拓扑重叠矩阵(TOM),这反映了基因之间的网络连通性。
2024-08-26 14:17:32
1421
原创 单细胞|MEBOCOST·基于代谢物的细胞通讯预测(一)
c. 详细的通讯情况(sender-receiver vs metabolite-sensor),可以指定receiver_focus/sensor_focus查看特定细胞类型。a. 查看每种细胞类型sender和receiver数量。f. 可视化细胞亚群的senor水平。1. 创建 mebocost 对象。e. 可视化细胞亚群的代谢物水平。b. 不同细胞类型的通讯情况。
2024-07-31 10:11:13
1289
1
原创 单细胞|MEBOCOST·细胞间代谢通讯
我们将分泌代谢物的细胞称为发送细胞,而表达感应蛋白的细胞称为接收细胞。为了分析发送和接收细胞之间的代谢物-感应器通信,开发了一种称为MEBOCOST的算法,该算法以处理过的单细胞RNA测序(scRNA-seq)数据为输入。• 由于代谢酶的RNA表达水平与代谢物丰度之间的关系通常是非线性的,MEBOCOST并不定量计算代谢物的丰度,而是推断代谢物的存在。:使用处理过的scRNA-seq数据,结合先前关于细胞外代谢物、代谢酶和代谢物-感应器伙伴的知识,检测代谢物-感应器通信。
2024-07-31 10:10:41
1429
原创 生信新包|Mellon·量化单细胞表型景观中的细胞状态密度
细胞状态密度是这种细胞分布的表现,受到基本生物过程的影响。增殖会增加某一状态下的细胞数目,从而提高细胞状态密度,而凋亡则降低细胞状态密度。Mellon使用高维表示的细胞状态(如扩散图),依赖邻近距离和密度之间的内在关系,通过最近邻距离的分布与细胞状态密度相关联。然后,Mellon使用高斯过程连接高度相似的细胞状态之间的密度,计算出表征单细胞表型景观的细胞状态密度。在时间序列数据集中,Mellon通过构建时间连续的密度函数,提供了高分辨率的发育过程描绘,揭示了稀有过渡细胞状态和重要的发育转变。
2024-07-01 18:01:55
793
1
原创 报错记录:在特定的conda环境中,打开Jupyter Notebook时遇到模块导入错误,但在终端中输入python并导入模块没有问题
,但在终端中输入python并导入模块没有问题,这通常是因为Jupyter Notebook没有正确使用你激活的conda环境中的Python解释器。:当你启动Jupyter Notebook时,它可能使用的是一个不同的Python内核,而不是你当前激活的conda环境。,然后选择你刚刚注册的内核("Python (yourenv)")。5.在Jupyter Notebook界面中,选择。3.将当前conda环境注册为Jupyter内核。在conda环境中安装并注册Jupyter内核。
2024-07-01 18:01:27
359
原创 单细胞|PyCoGAPS·非负矩阵分解整合单细胞数据
的全称是。它实现了一种贝叶斯马尔可夫链蒙特卡罗(MCMC)矩阵分解算法,称为 GAPS(Gene Activity Pattern Sets),并将其与基因集统计方法连接起来,以推断生物过程的活性。CoGAPS 可以对任何数据进行稀疏矩阵分解,当这些数据代表生物分子时,它还可以进行基因集分析。
2024-06-24 12:55:33
712
原创 DEPLOY·从组织病理学预测DNA甲基化肿瘤类型
其次,为了验证模型,DEPLOY分类器在来自Digital Brain Tumor Atlas (DBTA)、Children’s Brain Tumor Network (CBTN)和NCI–Prospective队列的外部H&E图像上进行了评估,分别包括1522名、348名和286名患者。通过这种方法,作者展示了深度学习在提高从H&E染色切片中获得的诊断准确性方面的潜力,为病理学家在诊断上具有挑战性的案例提供了快速评估,可能有助于推进资源有限地区的脑癌治疗。参考文献:Nature Medicine。
2024-05-30 14:57:56
417
原创 生信新包|LINGER·从单细胞多组学数据推断基因调控网络
题目:Inferring gene regulatory networks from single-cell multiome data using atlas-scale external data。
2024-05-07 16:50:55
1723
原创 记录:Mac终端连接远程服务器conda环境,在本地浏览器使用jupyter notebook
jupyter notebook只存在于服务器的某个conda环境里,想在Mac本地浏览器打开使用运行,如何操作?,以cellDancer为例,激活cellDancer环境,用户名前会出现(cellDancer)环境名称,终端-Shell-新建远程连接-ssh-添加服务器地址-输入用户名-连接-输入密码。本地浏览器输入localhost:xxxx(你设置的端口号),即可使用~,跳到文件最后一行,按。
2024-04-12 12:56:58
562
原创 生信新包|GeneTrajectory·单细胞基因轨迹推断
题目:Gene trajectory inference for single-cell data by optimal transport metricsGeneTrajectory 是一种推断单细胞数据中基因轨迹(而不是细胞轨迹)的方法,有助于理解生物过程中的基因动态。GeneTrajectory的主要工作流程:步骤 1. 构建一个单元格到单元格的 kNN 图,其中每个单元格都与其 k 个最近邻单元相连。找到连接图中每对单元格的最短路径,并将其长度表示为单元格之间的图形距离。
2024-04-12 12:56:43
1292
原创 生信文献|scINSIGHT·单细胞数据整合
与现有工具相比,scINSIGHT具有以下优点:(1)它能够在考虑单细胞样本的生物学条件的同时整合单细胞样本;(2)它明确地模拟生物条件中常见或特有的协调基因表达模式,从而能够从高维基因表达数据中分解常见和特定条件的基因模块;(3)它使用捕获细胞身份的通用基因模块实现了对单细胞样本中细胞群的精确识别;(4)它能够根据细胞组成和模块表达对样品和生物条件进行有效比较;scINSIGHT 使用基于非负矩阵分解的新模型来学习不同细胞类型和生物条件的基因表达模式。对细胞进行聚类并注释细胞类型或状态。
2024-04-09 13:00:49
415
原创 经验分享|生信数据分析R和python选哪个?
越来越多新的分析方法都是基于python的,建议R有一定基础的(指熟悉基本操作和常见R包的使用)的同学也尝试使用一下python。简单分享一下刚开始需要学习和注意的点(本人也是刚入门,不是专业的……这里需要注意python版本问题,有些包只在特定的python下才能安装运行,具体看每个包的教程,一般来说按照Tutorial安装都会成功。(3)常见报错的解决方法:这个得具体分析了,我遇到的主要问题还是前期环境配置以及使用过程中文件格式的问题。3.python和R的文件转换。1.python的使用。
2024-04-07 11:13:31
793
原创 单细胞|RNA速率下游 · Dynamo
1.将cellDancer的预测输入dynamo。3.学习和可视化 UMAP 上的矢量场。2.将 RNA 速率投影到嵌入空间上。4.Jacobian分析检测基因调控。数据集:cellDancer文件。在UMAP上绘制特定基因的表达。
2024-04-02 14:33:44
684
原创 单细胞 | Seurat文件生成
AllNuclei_snRNA_counts_rownames.txt.gz打开是基因信息(即features.tsv.gz),标准的features文件是两列,包括ensemble ID和symbol,这里只有一列,最简单的方法就是复制一下,变成两列,不然后面用Read10X读取文件会显示报错error in [.data.frame(category.matrix, , gene.group, drop = f) : undefined columns selected。
2024-04-02 13:57:38
816
原创 生信文献|SEACells·推断转录和表观基因组细胞状态
metacell:不同细胞状态的细胞群,代表了高度细化、不同的细胞状态,其中元细胞内的变异是由于技术因素而非生物因素引起的(单细胞细胞状态聚合(SEACells),这是一种基于图的算法,使用核原型分析来计算metacells。证明了SEACells 能够提供对scRNA-seq细胞状态的稳健、全面的特征描述,并且成功地描述了染色质细胞状态,其分辨率能够推断基因表达底层的调控元素。
2024-03-19 18:13:19
558
原创 单细胞 | RNA速率 · cellDancer
cellDancer 的输入数据包含‘gene_name’, ‘unsplice’, ‘splice’ ,‘cellID’ ,‘clusters’ ,‘embedding1’, and ‘embedding2.’。可视化5:展示预测动力学速率(转录α、剪接β和降解速率γ)、剪接 mRNA 丰度和未剪接 mRNA 丰度。3.估计样本的RNA速率:与scVelo不同的是,cellDancer是对。可视化4:显示剪接 RNA 沿伪时间的丰度。可视化2:每个基因的速率分析图。4.可视化1:RNA速率。
2024-02-27 17:22:57
561
原创 单细胞 | CellChat(二)· 多样本细胞互作
可视化5: 分别查看NL和LS差异较大的通路,从sender、receiver、mediator、influencer比较两组差异细胞类型,并可视化单个配体-受体对。例如:来自特应性皮炎患者的非病变(NL,正常)和病变(LS,患病)人类皮肤,这两个数据集在降维聚类后具有相同的细胞组成。可视化3:查看通路距离,距离越大意味着两个数据集之间的通信网络在功能或结构相似性方面差异越大,可重点关注差异较大的通路。可视化2:根据结构相似性和功能相似性识别信号组,和之前的图类似。二、可视化1:细胞群相互作用数量或强度。
2024-01-29 22:48:33
1893
原创 单细胞 | CellChat(一) · 单样本细胞互作
可视化4:根据结构相似性和功能相似性识别信号组。三.可视化1:celltype之间通讯结果。一.生成cellchat文件,选择数据库。可视化3:计算并可视化网络中心性分数。可视化2:特定信号通路的互作情况。
2024-01-19 11:08:17
1170
原创 单细胞 | pySCENIC·转录因子分析(二)
接上一篇,pySCENIC分析完之后就可以进行可视化了,个人认为最重要的有三个图:rss点图,rank图,转录因子表达水平热图,3个图结合着看。3.可视化rank图,可以自己改一下plotRSS_oneSet参数让图更好看一点。4. regulon表达水平热图,转录因子表达水平同理,得到的图类似只是输入不一样。2.可视化点图:寻找cluster特异性转录因子。1.loom文件读入R,提取数据。
2023-12-26 16:34:14
2529
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人