今天下午看课题的时候,突然好奇为何大家可以放心地直接在UMAP空间对于单细胞的基因向量进行分析,于是粗略研究了一下UMAP算法的原理。
参考链接:How UMAP Works — umap 0.5 documentation
主要大致梳理一下documentation的思路。
-
Topological Data Analysis and Simplicial Complexes
此段首先引入了simplex, simplicial complex的概念,主要是为了引出Čech complex的构造算法,为UMAP算法背后的数学奠基。
(图源

UMAP是一种用于降维和可视化高维数据的算法,它基于拓扑数据分析和simplicialcomplexes的概念。通过自适应地选择半径参数,UMAP能处理非均匀分布的真实世界数据。算法通过构建边的权重来反映点之间的连接概率,并寻找低维表示以最小化高维和低维图的交叉熵损失。在实际操作中,近邻考虑和负采样策略加速了计算过程。
最低0.47元/天 解锁文章
3659

被折叠的 条评论
为什么被折叠?



