在进行单细胞多组学分析时,我们经常会需要从GEO中下载单细胞表达矩阵数据(一般文献中也会乐于提供GEO编号),但当我们想要追溯测序或者基因组注释层面的优化时,就需要我们获取原始的转录本测序数据。以一篇文章的GEO为例,记录一下这个过程。
查找样本编号
这是一篇狨猴视网膜文章提供的GEO数据路径
下拉后是我们熟悉的单细胞表达矩阵的三个文件,之前的文章已经介绍过如何读取10X的三个文件进行分析,但我们今天要找的是更原始的转录本测序数据。
上拉界面找到样本来源,锁定我们想要查找的原始测序样本,记住GSM开头的这个编号
查看SRA数据组成
直接转到NCBI官网搜索这个编号