
生信数据
文章平均质量分 97
记录生物信息数据相关的本科学习内容
Echo-Nie
这里是我本科期间的笔记本,记录学习和成长
展开
-
ScanPy - Preprocessing and clustering 3k PBMCs (legacy workflow)工作复现
PCA用于将高维数据转换为低维数据,同时尽可能保留原始数据中的主要变异信息。寻找主成分:PCA通过计算数据的协方差矩阵,找到一组正交的“主成分”(即新的坐标轴)。这些主成分是数据中变异最大的方向。投影数据:将原始数据投影到这些主成分上,得到新的低维表示。主成分的数量通常远小于原始数据的维度。保留主要变异:通过选择前几个主成分(通常解释了大部分数据的变异),可以将数据从高维空间压缩到低维空间,同时保留最重要的信息。数据集是几维的?在单细胞RNA测序数据中,每个细胞的基因表达值构成了数据的一个维度。原创 2025-03-08 20:37:58 · 1439 阅读 · 0 评论 -
基因枷锁下的太空梦 —— 千钧一发观后感
千钧一发电影观后感记录。由于个人的记录习惯,比较喜欢先介绍一下电影中的主要人物,方便后续在写作过程中能够更快地将人名和角色对应起来。Vincent是一个未经基因改造的自然人(影片中验证身份的时候显示为In-Valid),天生患有近视和心脏病,预计寿命只有30岁。尽管如此,他始终怀揣着成为宇航员的梦想,并通过努力和伪装进入GATTACA。他凭借坚韧的毅力和对梦想的执着,最终实现了飞向太空的目标。Irene文森特在GATTACA公司的搭档原创 2025-03-03 10:14:00 · 1462 阅读 · 0 评论 -
Seurat - Guided Clustering Tutorial官方文档学习及复现
由于本人没有使用过Seurat4.0,而是直接使用的最新版。所以本文都是基于Seurat5.2.0(截止2025/3/6)来进行撰写。参考的官方教程来进行学习,肯定没有官方文档那么全面,有一些细节我直接略过了,比如说一些数据处理的原理以及数据集的详细信息都没有去仔细查看,之后如果用到的话再补一补。原创 2025-03-06 22:09:26 · 1851 阅读 · 0 评论