愿武艺晴小朋友一定得每天都开心!
第一步:下载安装GSEA 4.3.3的桌面版;安装好后的界面如下图所示:
第二步:下载C5 数据集下的GO subset of BP的基因集,点击Gene Symbols,下载基因ID为Symbol号的gmt格式文件。(人和小鼠是两个不一样的链接,要按自己的实际下载)
第三步:整理表达量数据。要求是第1列为gene Symbol,第2列的数据随意,因为软件会自动忽略,但第1列和第2列的列名必须是“Name”和“Deion”,接着的其他列:为不同样本对应的表达量,然后另存为制表符分隔的txt文件。
第四步:制作表型文件。
第1行包含3个数值,必须用空格分隔,其中第1个数值为样本数,第2个数值为分组数,第3个数值必须为1。第2行为比较组标签,第1个标签必须与表达量文件第1个样本相对应,也必须用空格分隔。第3行与表达量文件的样本顺序相对应,会出现在GSEA结果中的图表中,用制表符分隔。最后,将分组文件的拓展名改为“cls”。