胰腺癌与胚胎发生的关联及患者电子健康记录访问工作流研究
一、数据集与预处理
- 数据集分类
- 共有12个数据集,分为三类:
- 人类胚胎数据集(GSE15744),描述了人类胚胎从第4周到第9周的发育情况。
- 胰腺癌人类组织数据集(GSE32676 - GSE71989 - GSE19281 - GSE15471 - GSE16515 - GSE28735 - GSE62452),包含229个胰腺癌组织细胞样本和176个正常细胞样本。
- 胰腺癌人类外周血数据集(GSE49515 - GSE60601 - GSE15932 - GSE49641),包含38个胰腺癌患者外周血细胞样本和39个正常供体的正常细胞样本。
- 共有12个数据集,分为三类:
- 数据预处理
- 对所有数据集应用GC稳健多阵列平均(GCRMA)方法,该方法包括背景校正、分位数归一化和log2转换三个步骤。
- 除了GPL6244(缺少错配探针)使用oligo R包处理外,大多数数据集使用GCRMA R包处理。
| 数据集类型 | 数据集编号 | 样本情况 |
|---|---|---|
| 人类胚胎 |
超级会员免费看
订阅专栏 解锁全文
891

被折叠的 条评论
为什么被折叠?



